蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月

12月13日,在第二届CCF中国数据大会上,蚂蚁数科重磅宣布将全面开源其核心数据智能体技术Agentar SQL的全套资源,包括学术论文、源代码、预训练模型以及详细的使用指南。这一创新举措旨在推动企业数字化转型,使非专业人员也能通过自然语言轻松进行商业数据查询与分析,构建更精准高效的智能数据分析基座。

作为开源计划的首步,蚂蚁数科率先发布了实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供即插即用的数据查询解决方案,显著提升文本与数据库的交互效率。展望未来,蚂蚁数科计划在2026年陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架等关键模块,构建覆盖意图理解、业务理解到数据理解的全链路数据能力体系。

蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月插图1

据记者了解,在某头部城商行的试运营阶段,蚂蚁数科Agentar SQL系列工具的平均查询准确率高达92%,较传统查询方案效率提升超过3倍。值得一提的是,今年9月25日,由该技术支持的蚂蚁数科数据分析智能体Agentar-Scale-SQL在BIRD-SQL评测中表现惊艳,成功超越Google等国内外顶尖厂商,登顶全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准。目前,该智能体仍稳居BIRD-SQL准确率排行榜和执行效率榜的双榜第一,已连续领跑超过两个月。

BIRD-SQL作为全球最严苛的NL2SQL测试平台,要求AI模型在真实复杂的大规模生产级数据库中稳定执行自然语言到SQL的转换。其覆盖金融、电力、医疗等37个真实行业场景的庞大数据集(总量33GB,包含超1万条高复杂度查询任务),被业界誉为NL2SQL领域的”珠穆朗玛峰”。研究机构预测,到2025年,全球商业智能市场规模将突破474.8亿美元,其中中国商业智能与分析软件市场规模将达到120亿。预计到2028年,中国商业智能软件市场规模将达17.9亿美元,未来五年年复合增长率(CAGR)高达12.7%,成为企业智能技术建设的核心投资领域。

然而,中国企业商业智能产品应用现状呈现明显分层。大部分企业仍集中在报表、驾驶舱等数据可视化层面,而如何兼顾准确性同时提升真实生产环境可用性,成为NL2SQL规模化落地的普遍挑战。蚂蚁数科AI技术负责人章鹏在会上指出,NL2SQL实际落地面临四大核心难题:理解人类口语的多义性、整合庞大的行业专业知识、解析复杂的数据库结构关联,以及生成精准的复杂SQL语句。这些挑战表明,简单的模型”套壳”难以满足企业级应用需求。

蚂蚁数科开源Agentar SQL关键技术领跑全球榜单超两月插图2

以金融行业为例,从业者需要结合复杂业务规则和多条件组合进行数据查询才能有效分析产品数据;而在业务管理场景中,非专业分析人员的口语化提问,需要系统准确理解行业术语和询问意图,并与数据库字段实现精准匹配,才能产出可靠结果。章鹏强调,BIRD-SQL主要评测SQL生成能力,但真正实现产业级NL2SQL技术,必须构建更完整的能力栈。

蚂蚁数科提出”三驾马车”技术体系:1. 离线扩展(Offline Scaling)通过深度数据库理解与知识结构化;2. 人机交互(Human Interaction)实现智能体主动澄清意图的协作式交互;3. 自我进化(Self Evolution)通过记忆优化、工具创建等”免调优”技术,使智能体具备持续学习能力。目前,蚂蚁数科已计划逐步开源这些能力模块,包括数据库理解工具Agentar Profiling-SQL和免调优进化框架Agentar TuningFree-SQL等。

首期在线扩展框架Agentar-Scale-SQL开源内容已同步发布在arXiv、GitHub、ModelScope及Hugging Face等国际权威平台,迅速引发开发者社区热议,展现了强大的技术引领力和产业应用潜力。

最新快讯

2025年12月15日

16:40
近日,加拿大蒙特利尔上演了一场幸运的奇迹。20岁的女孩Brenda Aubin-Vega在购买彩票时,意外刮中了三个小猪存钱罐图案,从而赢得了魁北克彩票公司(Loto-Québec)最高奖金——100万加元(约合532万人民币)。这一突如其来的惊喜,不仅彻底改变了她的生活轨迹,更让她对未来充满了无限可能。 根据魁北克彩票公司的规定,中奖者可以选择两种兑奖方式...
16:40
12月14日,内蒙古包头市青山区自由路第二小学的校园里,一场别开生面的雪中趣事温馨上演,而这场欢乐的焦点,正是该校德育副校长。当日,整个校园被皑皑白雪轻轻覆盖,孩子们的欢声笑语在纯净的雪地上空回荡,构成一幅生动而美好的冬日画卷。这位副校长完全融入了这场雪趣之中,与学生们一起嬉戏打闹,尽情享受着冬日限定的快乐时光。 在欢快的互动中,学生们纷纷拿起晶莹剔透的雪球...
16:40
MCN机构正逐渐突破传统边界,从单纯的内容孵化者向多元化文化产品制造者转型。当短视频创作者还在激烈争夺流量时,蜂群文化旗下动漫IP"星有野"已开始筹备首部院线电影,这部由猫眼电影投资、制作成本超《浪浪山小妖怪》的项目预计两年后上映。蜂群文化CEO莫力洋表示:"这将是基于星有野世界的原创故事,是我们接下来的头号战略任务之一。" 今年10月底,无忧传媒携手上千位...
16:39
微新创想12月15日重磅报道,小米集团总裁卢伟冰近日更换了个人用机,其微博签名档悄然从"小米17 Pro Max"更新为"小米手机",这一微妙变化迅速引发业界关注。根据多方推测,卢伟冰新更换的机型极有可能就是备受期待的即将发布的小米17 Ultra旗舰手机。不少米粉粉丝在社交平台上纷纷留言询问:"卢总,17 Ultra的实际使用体验如何?" 目前公开资料显...
16:34
2025年12月15日,人工智能领域传来重磅消息,通义大模型正式宣布开源两款革命性的“百聆”语音模型,并完成了一系列关键升级。这两款模型不仅代表了语音技术的最新突破,更将开启语音交互的新纪元。 在音色克隆领域,Fun-CosyVoice3-0.5B模型实现了令人惊叹的零样本音色克隆技术。这意味着用户仅需3秒钟的录音样本,即可实现跨语种、方言乃至情感的精准语音...
16:34
2025年12月15日,中国电影发布最新业绩说明会内容,全面展示了公司当前及未来的创作布局。据披露,公司目前正推进近90个影视项目,其中原创项目占比高达约50个,彰显了公司对内容创新的坚定投入与雄厚实力。 2026年将是中国电影创作生产的关键一年,公司计划推出多部精彩影片,涵盖科幻、奇幻、历史、谍战等多元题材。重点参投及中小成本影片如《星河入梦》《大圣崛起》...
16:33
2025年12月15日,备受瞩目的半导体企业礼鼎半导体正式宣布成功完成B轮战略融资,此次投资由实力雄厚的深圳联道资产独家领投。作为国内领先的半导体封装载板解决方案提供商,礼鼎半导体长期致力于高阶封装载板的技术研发、精密制造与市场推广,其产品广泛应用于高速运算、5G通信、人工智能、物联网及车用电子等前沿领域。公司凭借卓越的技术实力和稳定的品质表现,已成功为高性...
16:33
2025年12月15日,努比亚官方携手徐州老味菜,共同推出一款极具特色的“手机饱食度套餐”,引发广泛关注。这款套餐精心挑选了四道地道徐州菜,包括香气扑鼻的地锅鸡、鲜嫩可口的京酱肉丝等经典美食,搭配两份香喷喷的米饭,为消费者带来一场味蕾盛宴。原价139元的套餐,在双方联合补贴后,惊喜降至99元,首批限量1000套,迅速引发抢购热潮。 此次合作是努比亚与徐州老味...
16:33
2025年12月,深圳核心医疗科技股份有限公司成功获得科创板IPO受理,标志着其成为科创板第五套标准重启后的首家获受理的创新医疗器械企业。这一里程碑事件不仅彰显了公司在医疗科技领域的创新实力,更凸显了其人工心脏产品在市场上的巨大潜力。 公司专注于人工心脏的研发与生产,其首款商业化产品Corheart®于2023年正式上市。该产品的推出不仅推动了公司营收的快速...
16:33
2025年12月15日,全球生物制药领域的重大交易再度上演。Sobi公司正式宣布与维亚生物达成战略合作,共同参与对Arthrosi公司的收购。这一备受瞩目的交易协议显示,Sobi将斥资最高15亿美元,全面收购Arthrosi的全部股权,标志着双方在创新药物研发领域的深度合作迈入新阶段。据悉,此次收购交易预计将于2026年上半年正式完成,此举将显著增强Sobi...
16:33
2025年12月15日,Medra公司正式宣布成功完成总额高达5200万美元的A轮融资。此次融资由Human Capital作为领投方强势入场,Lux Capital、Neo、NFDG、Catalio Capital Management、Menlo Ventures、776及Fusion Fund等多家知名投资机构紧随其后参与跟投。这一重大融资事件不仅彰显...
16:33
2025年12月14日,备受瞩目的微信输入法迎来重大升级,iOS版与Android版同步开启3.0.0版本内测。此次更新以语音输入为核心突破,全面引入先进的大模型技术,旨在大幅提升语音识别的速度与准确率,为用户带来前所未有的流畅体验。新版本不仅支持标准中文、英文输入,更扩展了多种方言的识别能力,满足不同地域用户的需求。特别值得一提的是,新增的不限时长录音功能...