蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月

2025-12-15 14:00:50 AI动态 1 次阅读

12月13日，在第二届CCF中国数据大会上，蚂蚁数科重磅宣布将全面开源其核心数据智能体技术Agentar SQL的全套资源，包括学术论文、源代码、预训练模型以及详细的使用指南。这一创新举措旨在推动企业数字化转型，使非专业人员也能通过自然语言轻松进行商业数据查询与分析，构建更精准高效的智能数据分析基座。

作为开源计划的首步，蚂蚁数科率先发布了实时文本转化结构化查询语言（Text-to-SQL）框架，为开发者提供即插即用的数据查询解决方案，显著提升文本与数据库的交互效率。展望未来，蚂蚁数科计划在2026年陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架等关键模块，构建覆盖意图理解、业务理解到数据理解的全链路数据能力体系。

据记者了解，在某头部城商行的试运营阶段，蚂蚁数科Agentar SQL系列工具的平均查询准确率高达92%，较传统查询方案效率提升超过3倍。值得一提的是，今年9月25日，由该技术支持的蚂蚁数科数据分析智能体Agentar-Scale-SQL在BIRD-SQL评测中表现惊艳，成功超越Google等国内外顶尖厂商，登顶全球最具权威性的自然语言转结构化查询语言（NL2SQL）评测基准。目前，该智能体仍稳居BIRD-SQL准确率排行榜和执行效率榜的双榜第一，已连续领跑超过两个月。

BIRD-SQL作为全球最严苛的NL2SQL测试平台，要求AI模型在真实复杂的大规模生产级数据库中稳定执行自然语言到SQL的转换。其覆盖金融、电力、医疗等37个真实行业场景的庞大数据集（总量33GB，包含超1万条高复杂度查询任务），被业界誉为NL2SQL领域的”珠穆朗玛峰”。研究机构预测，到2025年，全球商业智能市场规模将突破474.8亿美元，其中中国商业智能与分析软件市场规模将达到120亿。预计到2028年，中国商业智能软件市场规模将达17.9亿美元，未来五年年复合增长率（CAGR）高达12.7%，成为企业智能技术建设的核心投资领域。

然而，中国企业商业智能产品应用现状呈现明显分层。大部分企业仍集中在报表、驾驶舱等数据可视化层面，而如何兼顾准确性同时提升真实生产环境可用性，成为NL2SQL规模化落地的普遍挑战。蚂蚁数科AI技术负责人章鹏在会上指出，NL2SQL实际落地面临四大核心难题：理解人类口语的多义性、整合庞大的行业专业知识、解析复杂的数据库结构关联，以及生成精准的复杂SQL语句。这些挑战表明，简单的模型”套壳”难以满足企业级应用需求。

以金融行业为例，从业者需要结合复杂业务规则和多条件组合进行数据查询才能有效分析产品数据；而在业务管理场景中，非专业分析人员的口语化提问，需要系统准确理解行业术语和询问意图，并与数据库字段实现精准匹配，才能产出可靠结果。章鹏强调，BIRD-SQL主要评测SQL生成能力，但真正实现产业级NL2SQL技术，必须构建更完整的能力栈。

蚂蚁数科提出”三驾马车”技术体系：1. 离线扩展（Offline Scaling）通过深度数据库理解与知识结构化；2. 人机交互（Human Interaction）实现智能体主动澄清意图的协作式交互；3. 自我进化（Self Evolution）通过记忆优化、工具创建等”免调优”技术，使智能体具备持续学习能力。目前，蚂蚁数科已计划逐步开源这些能力模块，包括数据库理解工具Agentar Profiling-SQL和免调优进化框架Agentar TuningFree-SQL等。

首期在线扩展框架Agentar-Scale-SQL开源内容已同步发布在arXiv、GitHub、ModelScope及Hugging Face等国际权威平台，迅速引发开发者社区热议，展现了强大的技术引领力和产业应用潜力。