知识库规格定价、模型调用费用与免费额度
知识库采用按量付费模式,随时升降级,无最低消费。总费用由规格费用和模型调用费用两部分构成。
使用知识库的过程中,以下环节会产生模型调用费用,按各模型的实际用量独立计费:
规格费用按以下顺序依次抵扣,前一种耗尽后自动转入下一种:
除按量后付费外,也可预购资源包抵扣规格费用,购买后一年内有效。
删除知识库即停止该知识库的规格费用计算。
规格与定价
- 免费体验
- 标准版
- 旗舰版
首次开通赠送 720 小时免费额度,全能力开放体验。
| 项目 | 说明 |
|---|---|
| 价格 | ¥0 |
| 计算资源 | 共享池 |
| 检索 QPS | 1 QPS |
| 检索调用次数 | 不限 |
| 向量存储 | 免费 |
| 能力范围 | 全部核心能力解锁,API / MCP / CLI 全渠道接入 |
免费额度仅用于抵扣标准版知识库的规格费用,不包含模型调用费用。多个知识库同时运行会按数量累计扣减(例如同时运行 4 个知识库,每小时扣除 4 小时额度)。新用户免费额度自开通之日起 30 天内有效。
模型调用费用
使用知识库的过程中,以下环节会产生模型调用费用,按各模型的实际用量独立计费:
创建知识库时
| 环节 | 调用的模型 | 说明 |
|---|---|---|
| 向量化 | text-embedding-v4 或 text-embedding-v3 | 将文档切片转为向量表示,创建索引时触发。文档类知识库使用文本 Embedding 模型 |
| 向量化(多模态) | qwen3-vl-embedding | 图片 / 音视频知识库使用多模态 Embedding 模型 |
知识检索时
| 环节 | 调用的模型 | 说明 |
|---|---|---|
| 知识库路由 | qwen-plus | 开启知识库路由后,系统调用 qwen-plus 判断查询应路由到哪些知识库 |
| 排序(文档类) | qwen3-rerank | 对文档类知识库的检索结果做二次排序(可选) |
| 排序(图片/视频类) | qwen3-vl-rerank | 对图片 / 视频类知识库的检索结果做二次排序(可选) |
知识问答时
| 环节 | 调用的模型 | 说明 |
|---|---|---|
| 问答生成 | qwen3.6-plus 或 qwen3.7-plus | 在问答服务中选择生成模型,按模型实际调用量计费 |
| 排序 | qwen3-rerank | 问答服务中的检索阶段,使用排序模型对结果排序 |
| 预文件解析 | qwen3-rerank | 对话中上传文件并开启预文件解析时,使用排序模型 |
扣费顺序
规格费用按以下顺序依次抵扣,前一种耗尽后自动转入下一种:
1
免费额度
新用户开通即赠 720 小时免费额度,30 天内有效。仅用于抵扣标准版知识库的规格费用,多个知识库同时运行按数量累计扣减。耗尽后自动转入下一种扣费方式。
2
资源包
预购资源包抵扣规格费用,购买后一年内有效。耗尽或未购买时,自动转入按量后付费。
3
按量后付费
从阿里云账户余额按量扣费,按小时出账。
模型调用费用不参与上述抵扣顺序,按各模型实际用量独立计费。
资源包
除按量后付费外,也可预购资源包抵扣规格费用,购买后一年内有效。
查看用量与账单
停止计费
删除知识库即停止该知识库的规格费用计算。
欠费处理
| 阶段 | 说明 |
|---|---|
| 额度 / 资源包用尽 | 自动切换到按量后付费 |
| 账户欠费 | 进入宽限期,知识库仍可访问但无法创建新资源 |
| 超过宽限期 | 服务停止,数据保留 15 天 |
| 超过保留期 | 数据清理,不可恢复 |