知识检索 - Knowledge Studio

知识检索服务支持单知识库或多知识库联合检索，从知识库中精确搜索相关内容。通过控制台创建和配置检索服务，发布后可通过 API 集成到应用中。

创建检索服务

进入知识检索页面

登录控制台，进入 知识服务 → 知识检索。

创建服务

点击右上角 创建检索服务，在弹窗中填写：

服务名称（必填，最多 40 个字符）
描述信息（可选，最多 200 个字符）

点击确认完成创建。

绑定知识库

创建成功后自动进入配置页面。点击 + 添加，绑定一个或多个知识库（最多 15 个）。每个知识库可设置权重，权重数字越大，该知识库的检索结果在最终排序中优先级越高。

配置参数

配置全局检索参数（知识库路由、混排模型等），见下方全局检索配置。如需为单个知识库设置独立参数，点击知识库右侧的

图标，展开该知识库的配置面板，见下方知识库独立配置。

测试检索

在右侧的对话窗口中输入查询内容，查看返回的切片结果，包括相似度分数、来源文档和检索耗时。

发布

配置完成后，点击右上角发布。发布后可通过 API 调用该检索服务。

已创建至少一个知识库，且知识库中已有解析完成的文档。
如需使用多知识库联合检索，各知识库须位于同一业务空间下。

全局检索配置

以下参数对所有绑定的知识库统一生效：

参数	取值范围	说明
知识库路由	开/关	开启后系统依据检索意图自动判断需要查询哪些知识库，无需全部检索。路由判定依赖大模型，会产生模型调用费用
混排模型	qwen3-rerank / qwen3-rerank(hybrid) / qwen3-vl-rerank / 不使用模型	开启后使用混排模型对多知识库结果统一排序；关闭后各知识库独立排序。纯文本知识库可选 qwen3-rerank 系列；多模态知识库可选 qwen3-vl-rerank
混排模型模式	问答模式 / 相似模式 / 自定义高级模式	问答模式：按 QA 匹配度排序，优先匹配可能回答该 Query 的切片；相似模式：按语义相似度排序；自定义高级模式：自定义干预重排序模型
最大召回数量	1~20	混排后最终返回的切片总数量

知识库独立配置

点击知识库旁的展开图标，可配置该知识库的独立检索参数：

参数	取值范围	说明
Query 改写	开/关	对用户输入进行优化改写，提升检索效果
初步向量检索 TopK	1~100	向量检索阶段初步召回的切片数量
初步关键词检索 TopK	1~100	关键词检索阶段初步召回的切片数量
排序模型	qwen3-rerank 等 / 不使用模型	对该知识库的召回结果独立排序
排序模型模式	问答模式 / 相似模式	问答模式按 QA 匹配度排序；相似模式按语义相似度排序。仅在排序模型开启时可用
相似度阈值	0.01~1.0	过滤排序后分数低于阈值的切片。值越高结果越精确，但可能遗漏相关内容
最大召回数量	1~20	该知识库排序后返回的切片数量
标签过滤	—	根据文档标签过滤检索范围。输入标签后回车确认，或从下拉列表中选择已有标签

检索流程

知识检索服务收到查询请求后，按照以下流程返回结果：

Query 改写（可选）：对用户输入进行优化改写，提升检索效果。
向量检索 + 关键词检索：分别通过语义相似度和关键词匹配召回相关切片。
排序（Rerank）：使用排序模型对召回结果进行精排，过滤低分切片。
返回结果：排序后对原始语义分进行加权，最终按加权分数从高到低返回切片列表。

API 调用

通过检索接口调用：

curl -X POST https://{workspaceId}.cn-beijing.maas.aliyuncs.com/api/v1/indices/rag/index/retrieve \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "index_id": "<知识库ID>",
    "query": "如何配置切片策略？",
    "top_k": 5
  }'

返回的 nodes 数组包含命中切片，含原文内容、相关性分数与来源元数据。

这是单知识库底层检索接口，直接返回向量 + 关键词召回结果，不在此层做重排。如需 Rerank 精排，在创建检索服务时配置混排模型（见上方全局检索配置），通过检索服务的 API 调用。

​创建检索服务

​全局检索配置

​知识库独立配置

​检索流程

​API 调用

创建检索服务

全局检索配置

知识库独立配置

检索流程

API 调用