Skip to main content
通用

限流

各接口的请求频率限制

为保障服务稳定性,各接口设有请求频率限制(QPS,每秒请求数)。超出限制时返回 HTTP 429 Too Many Requests

知识库管理接口

接口端点QPS 上限
检索/rag/index/retrieve2,000
查询任务状态/rag/index_job/status20
查询文档列表/rag/index/files15
查询文件详情/rag/list/index/file/details10
创建知识库并导入/rag/index/create_v210
提交导入任务/rag/index/job/create10
查询知识库列表/rag/index/list10
更新知识库/rag/index/update10
删除知识库/rag/index/delete10
删除文档/rag/index/delete_file10
查询切片列表/pipeline/{id}/chunklist10
更新切片/rag/index/chunk/update10
删除切片/rag/index/chunk/delete10
获取监控数据/rag/index/monitor1

数据导入接口

接口端点QPS 上限
查询文件详情/describeFile10
删除文件/deleteFile10
申请上传租约/applyFileUploadLease10
注册文件/addFile10
查询类目列表/listCategory5
新增类目/addCategory5
删除类目/deleteCategory5
查询文件列表/listFile5
查询连接器/getConnector5
批量更新标签/batchUpdateFileTag5
新增连接器/addConnector2
OSS 批量导入/addFilesFromAuthorizedOss5

知识检索与问答

知识检索(/knowledge/search)和知识问答(/knowledge/chat)的限流规则暂未公布,后续更新。

超限处理

触发限流时,接口返回:
{
  "code": "Throttling",
  "status_code": 429,
  "message": "Requests rate limit exceeded, please try again later.",
  "request_id": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
}
建议:
  • 收到 429 后,使用指数退避策略重试(如间隔 1s → 2s → 4s)
  • 批量操作控制并发数,避免瞬时突发
  • 监控数据等低 QPS 接口,建议客户端缓存结果,减少调用频率
如果当前限额无法满足业务需求,请通过工单申请提升配额。