Skip to main content
数据接入

数据连接

通过数据连接器接入企业数据库、文档系统和对象存储,在应用中实时查询和引用数据

数据连接是管理外部数据源的统一入口。通过创建连接器,应用可以安全地访问企业数据库、文档系统和对象存储中的数据,在对话中实时查询和引用。

连接器类型

连接器按数据的存储和访问方式分为平台托管流处理两类:
联通格式连接器数据存储方式适用场景
平台托管文件平台存储或自有 OSS上传和管理非结构化文档(PDF、Word、Markdown 等)
平台托管表格平台存储或自有 OSS导入和查询结构化表格数据(CSV、Excel 等)
流处理MySQL数据保留在原数据库,实时访问连接 MySQL 数据库,执行 SQL 查询
流处理PostgreSQL数据保留在原数据库,实时访问连接 PostgreSQL 数据库,执行 SQL 查询
流处理PolarDB-X 2.0数据保留在原数据库,实时访问连接阿里云 PolarDB-X 2.0 分布式数据库
流处理语雀数据保留在语雀,实时访问访问语雀文档和知识库
流处理OSS数据保留在 OSS,实时访问访问对象存储中的文件
数据库连接器(MySQL / PostgreSQL / PolarDB-X 2.0)仅通过从 DMS 导入数据源方式创建时支持执行 SQL 查询。通过创建自定义数据源方式添加的连接器不支持直接执行 SQL。

前置条件

  • 账号权限:主账号或具有数据连接管理权限的 RAM 用户。
  • 数据源准备(按连接器类型):
连接器需要准备
文件 / 表格待上传的文件,或已创建 OSS Bucket
MySQLMySQL 数据库实例(阿里云 RDS 或自建),网络可达(公网或私网)
PostgreSQLPostgreSQL 数据库实例,且已将 wal_level 参数设为 logical
PolarDB-X 2.0阿里云 PolarDB-X 2.0 实例,所在地域支持私网访问
语雀语雀知识库(仅支持公网版本),已获取个人访问 Token
OSS已创建 OSS Bucket

创建连接器

进入控制台 数据接入 → 数据连接,点击 创建连接器,选择连接器类型后按以下说明填写配置。
  • 文件
  • 表格
  • MySQL
  • PostgreSQL
  • PolarDB-X 2.0
  • 语雀
  • OSS
文件连接器用于管理非结构化文档(PDF、Word 等)。
  1. 连接器类型选择 文件
  2. 填写连接器名称描述。描述会用于指导应用调用的准确度,建议写明数据内容和用途。
  3. 选择存储位置
    • 使用平台存储:数据存储在平台提供的存储空间,最多 100,000 个文件 / 1 TB,限时免费。
    • 使用自有 OSS 存储:数据存储在您自己的 OSS Bucket,适用于大规模数据。
选择自有 OSS 存储时,首次使用需按界面提示完成授权,且目标 Bucket 需添加 bailian-connector-access 标签(值为 ReadAndWrite)。前往 OSS 控制台添加标签
填写完成后,点击确认完成创建。

导入数据

连接器创建完成后,需要向连接器中导入数据。

文件连接器

  1. 在数据连接列表页点击目标连接器的详情按钮,进入连接器详情页的文件标签。
  2. 在左侧类目树中选择现有类目,或点击 + 新建类目。
  3. 点击导入数据,选择本地导入,上传文件。
  4. 选择解析方式(默认设置或自定义),系统自动完成文件解析。

数据库连接器

数据库连接器(MySQL / PostgreSQL / PolarDB-X 2.0)的数据保留在原数据库中,无需手动导入。连接器创建完成后即可通过连接器工具实时查询。

连接器工具

每个连接器自动暴露工具(Tools),供应用和智能体在对话中调用:
连接器类型工具功能
文件searchFile根据关键词搜索文件,返回下载链接
文件getFile获取指定文件的内容
数据库executeQuerySql执行 SQL 查询,返回 JSON 结果

数据导入 API

除控制台操作外,也可通过 API 管理数据导入。详见 API 参考 — 数据导入
数据导入 API(/api/v1/connector/dash/)与其他接口使用相同的 workspace 域名和鉴权方式,详见 API 概览
连接器配置完成后,继续创建知识库将连接器中的数据构建为可检索的索引。