Skip to main content
设置、计费与限制

计费说明

知识库规格定价、模型调用费用与免费额度

知识库采用按量付费模式,随时升降级,无最低消费。总费用由规格费用模型调用费用两部分构成。

规格与定价

  • 免费体验
  • 标准版
  • 旗舰版
首次开通赠送 720 小时免费额度,全能力开放体验。
项目说明
价格¥0
计算资源共享池
检索 QPS1 QPS
检索调用次数不限
向量存储免费
能力范围全部核心能力解锁,API / MCP / CLI 全渠道接入
免费额度仅用于抵扣标准版知识库的规格费用,不包含模型调用费用。多个知识库同时运行会按数量累计扣减(例如同时运行 4 个知识库,每小时扣除 4 小时额度)。新用户免费额度自开通之日起 30 天内有效。

模型调用费用

使用知识库的过程中,以下环节会产生模型调用费用,按各模型的实际用量独立计费:

创建知识库时

环节调用的模型说明
向量化text-embedding-v4text-embedding-v3将文档切片转为向量表示,创建索引时触发。文档类知识库使用文本 Embedding 模型
向量化(多模态)qwen3-vl-embedding图片 / 音视频知识库使用多模态 Embedding 模型

知识检索时

环节调用的模型说明
知识库路由qwen-plus开启知识库路由后,系统调用 qwen-plus 判断查询应路由到哪些知识库
排序(文档类)qwen3-rerank对文档类知识库的检索结果做二次排序(可选)
排序(图片/视频类)qwen3-vl-rerank对图片 / 视频类知识库的检索结果做二次排序(可选)

知识问答时

环节调用的模型说明
问答生成qwen3.6-plus 或 qwen3.7-plus在问答服务中选择生成模型,按模型实际调用量计费
排序qwen3-rerank问答服务中的检索阶段,使用排序模型对结果排序
预文件解析qwen3-rerank对话中上传文件并开启预文件解析时,使用排序模型
各模型的具体单价,点击上方模型名称链接查看百炼模型详情页。

扣费顺序

规格费用按以下顺序依次抵扣,前一种耗尽后自动转入下一种:
1

免费额度

新用户开通即赠 720 小时免费额度,30 天内有效。仅用于抵扣标准版知识库的规格费用,多个知识库同时运行按数量累计扣减。耗尽后自动转入下一种扣费方式。
2

资源包

预购资源包抵扣规格费用,购买后一年内有效。耗尽或未购买时,自动转入按量后付费。
3

按量后付费

从阿里云账户余额按量扣费,按小时出账。
模型调用费用不参与上述抵扣顺序,按各模型实际用量独立计费。

资源包

除按量后付费外,也可预购资源包抵扣规格费用,购买后一年内有效。
版本计量单位说明
标准版资源包个 × 小时按知识库数量 × 运行时长抵扣,多种规格可选
旗舰版资源包RCU × 小时按 RCU 数量 × 运行时长抵扣,多种规格可选

查看用量与账单

  • 知识库用量:在知识库详情页查看存储用量、检索 QPS 等监控数据,也可通过监控数据接口获取
  • 消费账单:在阿里云费用与成本页面查看统一账单、消费明细和余额充值

停止计费

删除知识库即停止该知识库的规格费用计算。
删除知识库会永久清除其中的所有数据,且无法恢复。

欠费处理

阶段说明
额度 / 资源包用尽自动切换到按量后付费
账户欠费进入宽限期,知识库仍可访问但无法创建新资源
超过宽限期服务停止,数据保留 15 天
超过保留期数据清理,不可恢复