阿里云析言 XiYan-SQL 全球夺冠 BIRD-CRITIC 评测第一

阿里云飞天实验室自主研发的数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断评测基准BIRD-CRITIC(也称SWE-SQL)中表现惊艳,以绝对优势登顶所有开放榜单,不仅超越了国内外多家顶尖团队,更刷新了SQL诊断与修复的行业纪录。这一突破性成果标志着大语言模型在解决真实数据库应用问题上的重大进展。

BIRD-CRITIC基准由学术界与Google Cloud联合推出,其核心目标在于验证大语言模型能否有效解决企业数据库应用中的各类实际问题。该评测平台精心设计了海量企业级数据库场景,涵盖了MySQL、PostgreSQL、SQL Server、Oracle等主流数据库系统的常见报错、性能瓶颈和查询需求。题目设计既包含基础查询操作,也涉及复杂的插入、更新、删除等高级操作,更融入了大量模型未曾接触过的全新场景,整体难度远超传统“自然语言生成SQL”测试,真正模拟了生产环境中的挑战。

在此次评测中,析言 XiYan-SQL在BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG和BIRD-CRITIC-Flash三大核心榜单上均斩获第一,同时在跨方言鲁棒性、复杂SQL处理能力、真实问题修复率和分布外泛化等多个关键维度获得权威机构的高度认可。技术层面,析言 XiYan-SQL通过创新性的相关模式筛选(Schema Filter)、多生成器集成(Multi-Generator Ensemble)以及候选重组与最优选择(Selection with Candidate Reorganization)等技术手段,实现了SQL生成质量、可执行性和可维护性的完美平衡。

阿里云析言 XiYan-SQL 全球夺冠 BIRD-CRITIC 评测第一插图1

这一智能模型特别擅长处理存在脏数据、异构模式以及跨方言差异的真实系统环境,能够提供高可靠性的诊断与修复方案。目前,基于XiYan-SQL技术打造的生成式商业智能(GBI)产品“析言”已在阿里云百炼平台正式上线,面向市场提供专业的SQL生成与诊断服务。

划重点:🔍 析言 XiYan-SQL在BIRD-CRITIC评测中力压群雄,斩获所有开放榜单第一名。📊 该评测全面覆盖主流数据库系统,测试难度远超传统SQL生成挑战。💻 相关技术已实现开源,开发者可体验并贡献代码,共同推动行业发展。

最新快讯

2025年12月05日

16:02
美国司法部近日对31岁播客主播布雷特・迈克尔・达迪格提起公诉,指控其犯有网络跟踪和跨州威胁罪,一旦定罪可能面临最高70年监禁和350万美元巨额罚款。这一案件之所以备受关注,不仅因为其严重性,更因为人工智能在其中扮演了令人不安的角色。 达迪格通过Instagram、Spotify和TikTok等社交平台发布大量内容,公开表达对寻找“妻子”的执念,以及他对女性的...
16:02
OpenAI 近期震撼发布其最新编程模型——GPT-5.1-Codex-Max,迅速成为开发者圈的热议焦点。这款新模型不仅在性能上实现了突破性提升,更在价格上延续了与前身 GPT-5 的持平策略,展现出 OpenAI 对开发者生态的深度考量。GPT-5.1-Codex-Max 最引人注目的特性在于其革命性的“代理式”编码能力,以及超乎寻常的长时间运行表现。通...
16:02
火山引擎今日重磅发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),这一技术升级不仅大幅提升了语音识别的推理性能,更实现了对多语言和视觉信息的精准解析,标志着语音识别技术迈入全新阶段。 豆包语音识别模型2.0在继承前代20亿参数高性能音频编码器优势的同时,重点针对复杂场景进行了深度优化。该模型通过专项训练,有效攻克了专有名词、人名、地名...
16:02
OpenAI 在与《纽约时报》及其他新闻机构的版权纠纷中遭遇重大挫折。曼哈顿联邦法院法官 Ona Wang 于本周三作出裁决,要求 OpenAI 提供数百万条 ChatGPT 用户的匿名聊天记录作为证据。这一决定对 OpenAI 来说无疑是沉重的打击,因为这些记录涉及高达 2000 万条用户交互数据,而法官认为这些数据对新闻机构的诉讼诉求至关重要。更关键的是...
16:02
在国际志愿者日这个充满温情与希望的日子里,阿里巴巴集团正式宣布,国内首款专为孤独症儿童设计的绘本智能体——“追星星的AI”已在千问APP平台成功上线。这一创新项目由阿里志愿者团队与魔搭社区开发者携手发起,致力于为孤独症儿童(星宝)打造更加富有情感共鸣与个性化表达的阅读新体验。 此次推出的2.0版本实现了革命性的“一句话生成绘本”功能。用户只需输入简短的故...
15:47
12月4日,杭州高光制药正式向香港交易所主板提交了上市申请,中金公司与招银国际联合担任联席保荐人。这家成立于2017年的生物科技公司,始终专注于自身免疫性疾病与神经退行性疾病的创新治疗,已成为临床阶段研发领域的佼佼者。根据最新披露的数据,高光制药已储备了七款候选药物,其中四款已成功进入临床研究阶段,展现出强劲的研发实力与管线布局。 在高光制药的众多产品中,核...
15:47
12月4日,杭州高光制药正式向香港交易所主板递交了上市申请,中金公司与招银国际联合担任本次联席保荐人。作为一家成立于2017年的生物科技企业,高光制药目前处于临床研发阶段,专注于开发治疗自身免疫性疾病和神经退行性疾病的小分子药物疗法。根据最新披露的数据,公司已储备了7款候选药物,其中4款已成功进入临床研究阶段。 随着全球医疗科技水平的持续进步,特别是针对自身...
15:47
科源制药(股票代码SZ301281)于2025年12月4日发布公告,宣布李春桦因个人原因正式卸任公司副总经理、董事会秘书及财务负责人等多重要职。这一变动消息传出后,公司迅速启动内部人才调整机制,于同日召开董事会会议,一致通过聘任秦坤为公司新任副总经理兼董事会秘书,并计划在近期内完成对财务负责人的选聘工作。 新任的秦坤先生出生于1983年,拥有经济学硕士学位,...
15:47
2025年上半年,中百集团展现出积极的战略调整态势,果断关闭了13家仓储大卖场,累计关店数量已达30家。这一决策主要基于门店经营效益不佳及租赁合同到期等现实因素,预计将给公司带来约1.8亿元人民币的损失。尽管短期内关店带来了一定的财务压力,但中百集团正通过优化资源配置,提升运营效率,为长期可持续发展奠定基础。 2025年前三季度,中百集团整体营收表现不尽如人...
15:47
高盛近日发布研报,将新易盛(sz300502)目标价上调11%以上,至502元人民币。这一上调主要基于对该公司未来增长潜力的乐观预期,特别是其在800G与1.6T光模块市场的强劲表现。高盛分析师认为,随着硅光技术的不断成熟和应用拓展,新易盛的产品竞争力将进一步提升,为其带来可观的业绩增长空间。 新易盛在光模块领域的布局正逐步显现成效。其1.6T光模块产品已于...
15:47
2025年全球亿万富翁人数历史性突破2900人,较前一年激增287位创下新高。瑞银集团最新发布的权威报告揭示,科技公司估值飙升与全球股市强劲表现是推动这一现象的核心动力。这些财富精英合计持有15.8万亿美元的惊人财富,较一年前的约2700位亿万富翁和14万亿美元财富总量实现了显著增长。值得注意的是,此次新增人数规模为2015年以来的第二高位,仅次于2021年...
15:47
科技媒体最新消息透露,备受期待的三星One UI 8.5测试版系统预计将在下周正式推送。这一全新版本将带来一系列令人耳目一新的界面革新,尤其是对时钟应用的全面重塑,堪称一次彻底的视觉升级。 新版本的核心亮点在于时钟应用的分层式界面设计,通过精心调校的渐变效果与图标阴影,营造出更加立体生动的视觉层次感。同时,系统将完美适配浅色与深色模式,满足不同用户在不同场景...