创建检索服务,实现多知识库联合语义搜索
知识检索服务支持单知识库或多知识库联合检索,从知识库中精确搜索相关内容。通过控制台创建和配置检索服务,发布后可通过 API 集成到应用中。
以下参数对所有绑定的知识库统一生效:
点击知识库旁的展开图标,可配置该知识库的独立检索参数:
知识检索服务收到查询请求后,按照以下流程返回结果:
通过 检索接口 调用:
返回的
创建检索服务
1
进入知识检索页面
登录控制台,进入 知识服务 → 知识检索。
2
创建服务
点击右上角 创建检索服务,在弹窗中填写:
- 服务名称(必填,最多 40 个字符)
- 描述信息(可选,最多 200 个字符)
3
绑定知识库
创建成功后自动进入配置页面。点击 + 添加,绑定一个或多个知识库(最多 15 个)。每个知识库可设置权重,权重数字越大,该知识库的检索结果在最终排序中优先级越高。
5
测试检索
在右侧的对话窗口中输入查询内容,查看返回的切片结果,包括相似度分数、来源文档和检索耗时。
6
发布
配置完成后,点击右上角 发布。发布后可通过 API 调用该检索服务。
- 已创建至少一个知识库,且知识库中已有解析完成的文档。
- 如需使用多知识库联合检索,各知识库须位于同一业务空间下。
全局检索配置
以下参数对所有绑定的知识库统一生效:
| 参数 | 取值范围 | 说明 |
|---|---|---|
| 知识库路由 | 开/关 | 开启后系统依据检索意图自动判断需要查询哪些知识库,无需全部检索。路由判定依赖大模型,会产生模型调用费用 |
| 混排模型 | qwen3-rerank / qwen3-rerank(hybrid) / qwen3-vl-rerank / 不使用模型 | 开启后使用混排模型对多知识库结果统一排序;关闭后各知识库独立排序。纯文本知识库可选 qwen3-rerank 系列;多模态知识库可选 qwen3-vl-rerank |
| 混排模型模式 | 问答模式 / 相似模式 / 自定义高级模式 | 问答模式:按 QA 匹配度排序,优先匹配可能回答该 Query 的切片;相似模式:按语义相似度排序;自定义高级模式:自定义干预重排序模型 |
| 最大召回数量 | 1~20 | 混排后最终返回的切片总数量 |
知识库独立配置
点击知识库旁的展开图标,可配置该知识库的独立检索参数:
| 参数 | 取值范围 | 说明 |
|---|---|---|
| Query 改写 | 开/关 | 对用户输入进行优化改写,提升检索效果 |
| 初步向量检索 TopK | 1~100 | 向量检索阶段初步召回的切片数量 |
| 初步关键词检索 TopK | 1~100 | 关键词检索阶段初步召回的切片数量 |
| 排序模型 | qwen3-rerank 等 / 不使用模型 | 对该知识库的召回结果独立排序 |
| 排序模型模式 | 问答模式 / 相似模式 | 问答模式按 QA 匹配度排序;相似模式按语义相似度排序。仅在排序模型开启时可用 |
| 相似度阈值 | 0.01~1.0 | 过滤排序后分数低于阈值的切片。值越高结果越精确,但可能遗漏相关内容 |
| 最大召回数量 | 1~20 | 该知识库排序后返回的切片数量 |
| 标签过滤 | — | 根据文档标签过滤检索范围。输入标签后回车确认,或从下拉列表中选择已有标签 |
检索流程
知识检索服务收到查询请求后,按照以下流程返回结果:
- Query 改写(可选):对用户输入进行优化改写,提升检索效果。
- 向量检索 + 关键词检索:分别通过语义相似度和关键词匹配召回相关切片。
- 排序(Rerank):使用排序模型对召回结果进行精排,过滤低分切片。
- 返回结果:排序后对原始语义分进行加权,最终按加权分数从高到低返回切片列表。
API 调用
通过 检索接口 调用:
nodes 数组包含命中切片,含原文内容、相关性分数与来源元数据。
这是单知识库底层检索接口,直接返回向量 + 关键词召回结果,不在此层做重排。如需 Rerank 精排,在创建检索服务时配置混排模型(见上方全局检索配置),通过检索服务的 API 调用。