蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月

12月13日,在第二届CCF中国数据大会上,蚂蚁数科重磅宣布将全面开源其核心数据智能体技术Agentar SQL的全套资源,包括学术论文、源代码、预训练模型以及详细的使用指南。这一创新举措旨在推动企业数字化转型,使非专业人员也能通过自然语言轻松进行商业数据查询与分析,构建更精准高效的智能数据分析基座。

作为开源计划的首步,蚂蚁数科率先发布了实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供即插即用的数据查询解决方案,显著提升文本与数据库的交互效率。展望未来,蚂蚁数科计划在2026年陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架等关键模块,构建覆盖意图理解、业务理解到数据理解的全链路数据能力体系。

蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月插图1

据记者了解,在某头部城商行的试运营阶段,蚂蚁数科Agentar SQL系列工具的平均查询准确率高达92%,较传统查询方案效率提升超过3倍。值得一提的是,今年9月25日,由该技术支持的蚂蚁数科数据分析智能体Agentar-Scale-SQL在BIRD-SQL评测中表现惊艳,成功超越Google等国内外顶尖厂商,登顶全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准。目前,该智能体仍稳居BIRD-SQL准确率排行榜和执行效率榜的双榜第一,已连续领跑超过两个月。

BIRD-SQL作为全球最严苛的NL2SQL测试平台,要求AI模型在真实复杂的大规模生产级数据库中稳定执行自然语言到SQL的转换。其覆盖金融、电力、医疗等37个真实行业场景的庞大数据集(总量33GB,包含超1万条高复杂度查询任务),被业界誉为NL2SQL领域的”珠穆朗玛峰”。研究机构预测,到2025年,全球商业智能市场规模将突破474.8亿美元,其中中国商业智能与分析软件市场规模将达到120亿。预计到2028年,中国商业智能软件市场规模将达17.9亿美元,未来五年年复合增长率(CAGR)高达12.7%,成为企业智能技术建设的核心投资领域。

然而,中国企业商业智能产品应用现状呈现明显分层。大部分企业仍集中在报表、驾驶舱等数据可视化层面,而如何兼顾准确性同时提升真实生产环境可用性,成为NL2SQL规模化落地的普遍挑战。蚂蚁数科AI技术负责人章鹏在会上指出,NL2SQL实际落地面临四大核心难题:理解人类口语的多义性、整合庞大的行业专业知识、解析复杂的数据库结构关联,以及生成精准的复杂SQL语句。这些挑战表明,简单的模型”套壳”难以满足企业级应用需求。

蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月插图2

以金融行业为例,从业者需要结合复杂业务规则和多条件组合进行数据查询才能有效分析产品数据;而在业务管理场景中,非专业分析人员的口语化提问,需要系统准确理解行业术语和询问意图,并与数据库字段实现精准匹配,才能产出可靠结果。章鹏强调,BIRD-SQL主要评测SQL生成能力,但真正实现产业级NL2SQL技术,必须构建更完整的能力栈。

蚂蚁数科提出”三驾马车”技术体系:1. 离线扩展(Offline Scaling)通过深度数据库理解与知识结构化;2. 人机交互(Human Interaction)实现智能体主动澄清意图的协作式交互;3. 自我进化(Self Evolution)通过记忆优化、工具创建等”免调优”技术,使智能体具备持续学习能力。目前,蚂蚁数科已计划逐步开源这些能力模块,包括数据库理解工具Agentar Profiling-SQL和免调优进化框架Agentar TuningFree-SQL等。

首期在线扩展框架Agentar-Scale-SQL开源内容已同步发布在arXiv、GitHub、ModelScope及Hugging Face等国际权威平台,迅速引发开发者社区热议,展现了强大的技术引领力和产业应用潜力。

最新快讯

2025年12月17日

11:36
2025年12月17日,科技界传来重磅消息,人工智能巨头OpenAI正与电商巨头亚马逊就一项大规模融资计划展开深度谈判。据多方消息源透露,OpenAI计划从亚马逊手中筹集至少100亿美元巨额资金,这一数字足以支撑其未来数年的研发投入。更引人注目的是,双方已初步达成共识,OpenAI将采用亚马逊自研的人工智能芯片来满足其庞大的计算需求,这标志着两大科技巨头在A...
11:36
2025年12月17日,Montran公司隆重宣布其位于肯尼亚内罗毕的非洲区域总部Montran Africa正式启用。这一战略举措标志着Montran在非洲金融领域的深耕布局迈入全新阶段,该总部将全面承担公司在非洲地区的客户服务、项目实施以及本地化创新的核心职能。作为公司在非洲大陆的重要运营枢纽,新总部由区域执行董事Wohoro Ndohho亲自挂帅,致力...
11:36
2026年1月1日,中国民航局精心打造的《民用航空货物运输备案事项实施办法》将正式拉开帷幕,标志着我国航空货运行业迈入全新的透明化与规范化时代。这项由民航局权威制定的行业新规,不仅彰显了监管机构对货运市场秩序的重视,更将推动整个行业朝着更加健康、有序的方向发展。办法的核心亮点在于对企业备案信息的真实性与及时性提出了明确要求,这意味着所有参与航空货物运输的企业...
11:36
2025年12月17日,中国科学院脑科学与智能技术卓越创新中心传来振奋人心的消息,第二例侵入式脑机接口临床试验取得重大突破,成功实现了从二维屏幕控制到三维物理世界交互的技术飞跃。这项革命性进展标志着脑机接口技术正迈向更实用化、更智能化的新阶段。 这项临床试验的主角是一位因脊髓损伤导致四肢瘫痪的中年男性患者。自2025年6月接受微创脑机接口系统植入以来,经过科...
11:36
2025年12月17日,美国得克萨斯州总检察长肯·帕克斯顿正式对五大家电巨头发起集体诉讼,将三星、LG、索尼、海信和TCL一并告上法庭。此次诉讼的核心指控是这些企业在其智能电视产品中系统性地滥用自动内容识别(ACR)技术,实施大规模用户监视行为。据调查,这些智能电视具备惊人的数据采集能力,能够每秒对用户屏幕进行两次截图,从而精准追踪用户观看的流媒体视频、在线...
11:36
2025年12月17日,国家卫生健康委携手教育部、科技部、财政部、人社部及医保局等六部门,共同印发《关于加强基层医疗卫生机构特色科室建设的指导意见》,为我国基层医疗体系建设注入新动能。这份重磅文件明确指出,要全面贯彻落实医疗卫生强基工程的核心要求,着力强化基层医疗服务能力,显著提升医疗服务质量,并积极推动医防协同与深度融合,构建覆盖预防、治疗、康复、健康管理...
11:36
2025年,大中华区制造行业WMS(仓储管理系统)市场规模预计将突破12.8亿元大关,同比增长率高达16.9%。这一关键数据源自权威发布的《2026大中华区制造行业仓储管理WMS系统行业白皮书》,揭示了该领域强劲的发展势头。值得注意的是,在2022至2025年间,该市场已展现出9.3%的稳健复合年增长率,为未来的高速增长奠定了坚实基础。 展望未来,行业增长预...
11:36
SEMI在刚刚结束的SEMICON Japan 2025展会上重磅发布最新行业预测:2025年全球半导体制造设备市场规模将突破1330亿美元大关,较去年同期实现13.7%的强劲增长,这一增长趋势已延续自2024年创下的历史新高。值得注意的是,测试设备领域成为本次市场增长的绝对亮点,预计全年营收将激增48.1%,达到112亿美元的惊人规模,充分彰显了该细分市场...
11:36
2025年12月17日,昆山美淼科技正式宣布成功完成A+轮融资,投资方为知名产业资本太一资产。作为电化学设备及工业用钛阳极领域的领军企业,美淼科技凭借其前瞻性的技术布局,在行业内树立了新的标杆。公司核心亮点在于创新研发的MOC™(摩科碳™)电极技术,该技术通过突破性材料科学应用,显著提升了钛阳极的使用效率,为工业电化学应用带来了革命性进步。 美淼科技的MOC...
11:07
微新创想12月17日重磅报道,小米集团于今日成功举办了2025小米人车家全生态合作伙伴大会。在备受瞩目的峰会上,小米集团总裁卢伟冰发表了题为《一路同行,澎湃未来》的主题演讲,为与会嘉宾描绘了小米在智能生态领域的宏伟蓝图。卢伟冰在演讲中宣布了一项具有里程碑意义的重大成果——小米自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线,并强调这是小米迈...
11:07
12月17日重磅消息,在刚刚落幕的2025小米人车家全生态合作伙伴大会上,小米集团合伙人、集团总裁卢伟冰携团队震撼官宣:openvela全球合作伙伴数量已强势突破100家大关,搭载该平台的智能设备累计总量更是高达1.6亿台!这一里程碑式的成就,不仅彰显了小米生态链的强大凝聚力,更凸显了openvela在物联网领域的领先地位。 卢伟冰在会上详细介绍了openv...
11:07
微新创想12月17日重磅报道,小米集团于今日成功举办了2025小米人车家全生态合作伙伴大会,这场备受瞩目的行业盛会不仅汇聚了众多合作伙伴,更标志着小米在智能生态领域迈出了崭新的一步。小米集团合伙人、集团总裁卢伟冰发表了题为《一路同行,澎湃未来》的主题演讲,为与会嘉宾描绘了小米未来的发展蓝图。 在演讲中,卢伟冰详细分享了小米手机业务的最新进展。第三方权威数据显...