让数据查询又快又准,瓴羊 Dataphin MCP 保姆级教程来了
在 AI Agent 蓬勃发展的当下, 优质数据资产已然成为释放 AI 生产力的关键因素。Dataphin 作为瓴羊旗下一站式数据建设和治理工具, 拥有庞大的元数据知识, 包括逻辑模型、资产元数据信息、业务知识 (标准、指标、码表) 等。为了帮助企业更好地挖掘数据资产,Dataphin 推出 MCP 服务, 助力 Agent 高效获取数据。
什么是 MCP?
MCP (Model Context Protocol) 是由 Anthropic 公司提出的开源协议, 旨在解决 AI 应用程序与外部数据源、应用的集成问题。在没有 MCP 之前,AI 应用程序的开发者普遍通过 Function Call 的方式来与外部应用进行集成, 普遍面临着如下困境:
1、开发复杂度高: 需要在应用中通过硬编码的方式适配不同平台的 API, 每一个任务都需要单独开发和维护;
2、复用性低: 每个集成模块通常是为特定任务定制的, 缺乏通用性和可移植性, 难以在其他项目中复用;
MCP 定义了为大模型提供上下文的接口标准, 使其能够无缝连接各种外部应用的数据, 可以通过插拔式的配置决定 AI 应用是否集成某个应用, 大大降低了开发成本, 提高了可复用性。
Dataphin MCP
Dataphin MCP 采用 SSE (Server-Sent Events) 协议, 如下是对应的 JSON 配置:
Dataphin MCP 目前提供两个与数据服务相关的 Tools, 分别为:
1、listDataServiceAPI: 根据所提供的应用, 获取有权限调用的数据服务 API 信息, 包括 API ID、输入和输出参数、API 调用文档等
2、invokeDataServiceAPI: 调用数据服务 API 来获取数据
场景举例
作为行业 360 的开发人员, 您通过 Dataphin 数据服务 API 来获取商品、用户、订单等数据。现在公司期望您能开发一款移动端的信息查询工具, 让运营同学可以随时随地查询用户信息、订单数据等。
您可以通过“大模型”+“Dataphin MCP”的方式, 快速构建数据查询助手。演示如下:
1、创建一个“智能查询助手”, 关联 Dataphin MCP 服务, 图中以百炼为例;
2、在右侧输入您的问题测试模型效果, 以“帮我查询今年所有品类的销售额, 同时查询销售额第一的品类中单品销量 TO1”问题为例。
首先, 模型会调用 listDataServiceAPI 这个 Tool 以查询所有可调用的 API;
然后, 模型会根据可用的 API 名称、描述、入参等信息, 规划出为了解决当前用户问题需要调用哪些 API。在本问题中, 模型从众多 API 中选择了两个 API 进行调用, 并将调用结果呈现给用户, 分别是:QueryTransactionByProductCategory(根据产品品类查询总交易额) 和 QueryProductSaleInCat (查询指定品类下每个商品的销售额)
结语
未来瓴羊 Dataphin 将持续丰富和迭代 MCP Server 的工具集, 包括数据研发、任务运维、数据治理等, 有了这些工具您可以通过自然语言体验更多的场景, 例如:
1、查询项目 A 中的任务运行状态, 并对失败实例进行批量重跑;
2、在项目 A 中创建一个集成任务, 其中数据来源于 MySQL 数据库的表, 同步到项目计算源中, 并一键建表;
3、创建一个规则强度为弱的质量规则, 要求被监控字段需要满足国内有效的电话号码格式, 同时将表的字段作为监控对象;
目前 Dataphin MCP 处于公测阶段, 联系瓴羊进行尝鲜体验!