为保障服务稳定性,各接口设有请求频率限制(QPS,每秒请求数)。超出限制时返回 HTTP 429 Too Many Requests。
知识库管理接口
| 接口 | 端点 | QPS 上限 |
|---|
| 检索 | /rag/index/retrieve | 2,000 |
| 查询任务状态 | /rag/index_job/status | 20 |
| 查询文档列表 | /rag/index/files | 15 |
| 查询文件详情 | /rag/list/index/file/details | 10 |
| 创建知识库并导入 | /rag/index/create_v2 | 10 |
| 提交导入任务 | /rag/index/job/create | 10 |
| 查询知识库列表 | /rag/index/list | 10 |
| 更新知识库 | /rag/index/update | 10 |
| 删除知识库 | /rag/index/delete | 10 |
| 删除文档 | /rag/index/delete_file | 10 |
| 查询切片列表 | /pipeline/{id}/chunklist | 10 |
| 更新切片 | /rag/index/chunk/update | 10 |
| 删除切片 | /rag/index/chunk/delete | 10 |
| 获取监控数据 | /rag/index/monitor | 1 |
数据导入接口
| 接口 | 端点 | QPS 上限 |
|---|
| 查询文件详情 | /describeFile | 10 |
| 删除文件 | /deleteFile | 10 |
| 申请上传租约 | /applyFileUploadLease | 10 |
| 注册文件 | /addFile | 10 |
| 查询类目列表 | /listCategory | 5 |
| 新增类目 | /addCategory | 5 |
| 删除类目 | /deleteCategory | 5 |
| 查询文件列表 | /listFile | 5 |
| 查询连接器 | /getConnector | 5 |
| 批量更新标签 | /batchUpdateFileTag | 5 |
| 新增连接器 | /addConnector | 2 |
| OSS 批量导入 | /addFilesFromAuthorizedOss | 5 |
知识检索与问答
知识检索(/knowledge/search)和知识问答(/knowledge/chat)的限流规则暂未公布,后续更新。
超限处理
触发限流时,接口返回:
{
"code": "Throttling",
"status_code": 429,
"message": "Requests rate limit exceeded, please try again later.",
"request_id": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
}
建议:
- 收到 429 后,使用指数退避策略重试(如间隔 1s → 2s → 4s)
- 批量操作控制并发数,避免瞬时突发
- 监控数据等低 QPS 接口,建议客户端缓存结果,减少调用频率
如果当前限额无法满足业务需求,请通过工单申请提升配额。