
在近日举办的第二届CCF中国数据大会上,蚂蚁数科携其创新成果重磅亮相,正式宣布开源旗下领先的数据智能体技术——Agentar SQL。这一突破性技术的推出,将彻底改变普通用户与复杂数据交互的方式,让商业数据查询和分析变得如同日常对话般简单直观,为各行各业企业的数字化转型注入强大动力。此次开源的首个产品是实时文本转结构化查询语言(Text-to-SQL)框架,该框架专为开发者设计,能够快速构建高效的数据查询方案,显著提升文本与数据库之间的交互效率。未来,蚂蚁数科还将陆续推出包括数据库理解、行业知识挖掘及实时多轮交互等系列先进技术,构建全方位的数据处理能力体系。
在某领先的城市商业银行的试运营阶段,Agentar SQL的多款工具展现出卓越性能,查询准确率高达92%以上,较传统方案效率提升超过三倍。更令人瞩目的是,蚂蚁数科的智能体技术在全球权威的自然语言转SQL评测基准BIRD-SQL中表现惊艳,力压Google等国际科技巨头,位列全球前茅,成为该领域的行业领跑者。BIRD-SQL评测以其极高的难度著称,其数据集覆盖金融、电力、医疗等37个真实复杂场景,任务要求高且数据量庞大,被公认为全球最具挑战性的NL2SQL测试之一。

根据权威研究机构预测,到2025年,全球商业智能市场规模将突破474.8亿美元大关,而中国市场的增长势头尤为强劲,预计到2028年将达到17.9亿美元,年复合增长率高达12.7%。蚂蚁数科的技术负责人章鹏在大会上深入剖析了NL2SQL技术在实际应用中面临的四大核心挑战:理解人类口语的模糊性、整合行业专业知识、解析复杂数据库结构以及生成精准SQL语句。他指出,单纯依靠简单模型难以应对这些复杂需求,真正实现产业级可用的NL2SQL及数据智能体技术,必须构建完整的能力体系。
章鹏强调,这一能力体系应包含三个关键维度:对数据库的深度理解、智能体与用户的高效交互机制以及自我进化的学习能力。蚂蚁数科计划在未来持续开源更多全面的能力模块,进一步推动智能数据分析技术的普及和应用。目前,Agentar-Scale-SQL的开源内容已在arXiv、GitHub等国际知名平台发布,并迅速吸引了全球开发者的广泛关注,标志着中国在数据智能领域的技术实力正迈向国际前沿。
