Skip to main content
知识服务

知识检索

创建检索服务,实现多知识库联合语义搜索

知识检索服务支持单知识库或多知识库联合检索,从知识库中精确搜索相关内容。通过控制台创建和配置检索服务,发布后可通过 API 集成到应用中。

创建检索服务

1

进入知识检索页面

登录控制台,进入 知识服务 → 知识检索
2

创建服务

点击右上角 创建检索服务,在弹窗中填写:
  • 服务名称(必填,最多 40 个字符)
  • 描述信息(可选,最多 200 个字符)
点击 确认 完成创建。
3

绑定知识库

创建成功后自动进入配置页面。点击 + 添加,绑定一个或多个知识库(最多 15 个)。每个知识库可设置权重,权重数字越大,该知识库的检索结果在最终排序中优先级越高。
4

配置参数

配置全局检索参数(知识库路由、混排模型等),见下方全局检索配置如需为单个知识库设置独立参数,点击知识库右侧的 设置 图标,展开该知识库的配置面板,见下方知识库独立配置
5

测试检索

在右侧的对话窗口中输入查询内容,查看返回的切片结果,包括相似度分数、来源文档和检索耗时。
6

发布

配置完成后,点击右上角 发布。发布后可通过 API 调用该检索服务。
  • 已创建至少一个知识库,且知识库中已有解析完成的文档。
  • 如需使用多知识库联合检索,各知识库须位于同一业务空间下。

全局检索配置

以下参数对所有绑定的知识库统一生效:
参数取值范围说明
知识库路由开/关开启后系统依据检索意图自动判断需要查询哪些知识库,无需全部检索。路由判定依赖大模型,会产生模型调用费用
混排模型qwen3-rerank / qwen3-rerank(hybrid) / qwen3-vl-rerank / 不使用模型开启后使用混排模型对多知识库结果统一排序;关闭后各知识库独立排序。纯文本知识库可选 qwen3-rerank 系列;多模态知识库可选 qwen3-vl-rerank
混排模型模式问答模式 / 相似模式 / 自定义高级模式问答模式:按 QA 匹配度排序,优先匹配可能回答该 Query 的切片;相似模式:按语义相似度排序;自定义高级模式:自定义干预重排序模型
最大召回数量1~20混排后最终返回的切片总数量

知识库独立配置

点击知识库旁的展开图标,可配置该知识库的独立检索参数:
参数取值范围说明
Query 改写开/关对用户输入进行优化改写,提升检索效果
初步向量检索 TopK1~100向量检索阶段初步召回的切片数量
初步关键词检索 TopK1~100关键词检索阶段初步召回的切片数量
排序模型qwen3-rerank 等 / 不使用模型对该知识库的召回结果独立排序
排序模型模式问答模式 / 相似模式问答模式按 QA 匹配度排序;相似模式按语义相似度排序。仅在排序模型开启时可用
相似度阈值0.01~1.0过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容
最大召回数量1~20该知识库排序后返回的切片数量
标签过滤根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签

检索流程

知识检索服务收到查询请求后,按照以下流程返回结果:
  1. Query 改写(可选):对用户输入进行优化改写,提升检索效果。
  2. 向量检索 + 关键词检索:分别通过语义相似度和关键词匹配召回相关切片。
  3. 排序(Rerank):使用排序模型对召回结果进行精排,过滤低分切片。
  4. 返回结果:排序后对原始语义分进行加权,最终按加权分数从高到低返回切片列表。

API 调用

通过 检索接口 调用:
curl -X POST https://{workspaceId}.cn-beijing.maas.aliyuncs.com/api/v1/indices/rag/index/retrieve \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "index_id": "<知识库ID>",
    "query": "如何配置切片策略?",
    "top_k": 5
  }'
返回的 nodes 数组包含命中切片,含原文内容、相关性分数与来源元数据。
这是单知识库底层检索接口,直接返回向量 + 关键词召回结果,不在此层做重排。如需 Rerank 精排,在创建检索服务时配置混排模型(见上方全局检索配置),通过检索服务的 API 调用。