SuperCLUE正式发布了“2025年度中文大模型基准测评报告”,这场汇聚了23个国内外顶尖模型的“全明星赛”,再次揭示了全球AI战局的新动向。测评覆盖了数学推理、代码生成及科学推理等六大核心维度,直观展示了当前中文语境下各大模型的真实“战力”。

image.png

从综合排名来看,海外闭源模型依然展现出强大的统治力。Anthropic旗下的Claude-Opus-4.5-Reasoning凭借68.25的高分问鼎榜首,谷歌的Gemini-3-Pro-Preview与OpenAI的GPT-5.2(high)紧随其后,分别夺得亚军和季军。这三大巨头构成的“第一梯队”,在逻辑严密性和综合理解力上依然保持着微弱的领先优势。

然而,国产大模型的表现堪称惊喜,正以前所未有的速度缩小差距。国内开源界的“领头羊”Kimi-K2.5-Thinking与闭源代表Qwen3-Max-Thinking分别杀入全球前十,位列第四和第六。值得振奋的是,在垂直赛道上,国产模型已经实现了“局部反超”:Kimi在代码生成任务中勇夺全球第一,而Qwen3则在数学推理上与谷歌并列世界冠军。

纵观整体格局,海内外呈现出截然不同的竞争态势。闭源领域目前是“海外领跑、国产追赶”;而在开源领域,国产模型则占据了绝对的主导地位,国内开源Top5的实力已大幅领先海外同类模型。这种“开闭并进”的局面,预示着中文AI生态正进入一个高质量发展的爆发期。

划重点:

  • 🏆 海外巨头领跑: Claude-Opus-4.5-Reasoning以最高分位居全球中文大模型战力榜首,海外闭源模型依然包揽前三名。

  • 🚀 国产局部超越: Kimi-K2.5-Thinking在代码生成领域夺冠,Qwen3-Max-Thinking则在数学推理上与谷歌Gemini并列全球第一

  • 📊 开源国产主导: 在开源模型阵营中,国产模型表现远超海外竞争对手,展现了国内大模型生态在开放协作方面的独特优势。

最新快讯

2026年02月04日

18:06
2026年2月3日,中国人工智能产业发展联盟第十六次全会在北京石景山盛大召开。会议释放出强烈信号:我国将全力推进“人工智能+制造”向深层次发展,将制造业打造成为 AI 赋能的主战场。四项重拳出击:构建智能化工业体系针对下一步发展,工信部明确了四个关键发力点,旨在全面提升产业竞争力:技术攻坚:做强应用根基重点突破算力芯片、工业大模型等核心关键技术,为工业智能化...
17:38
2026年2月4日上午,重庆奉建高速控制性工程大溪河特大桥顺利合龙。该桥全长1662米,主跨650米,为世界最大跨度双边工字型组合梁斜拉桥。项目地处渝东北深山峡谷,地质复杂、施工难度大,建设方采用智能爬模技术实现高精度安全作业。奉建高速全长约48公里,桥隧比88%,是G6911安康至来凤段关键组成部分。通车后,奉节至建始车程将由3小时缩短至40分钟,显著提...
17:38
2月4日,AI生物研究实验室PhyloPhylo宣布完成1350万美元种子轮融资,由Anthology Fund与Andreessen Horowitz(a16z)联合领投。该公司总部位于美国,专注于开发人工智能工具,助力生物学家加速基因组分析、进化建模等科研任务。本轮融资将用于扩大工程与计算生物学团队,并推进其首个开源AI平台的开发与部署。PhyloPh...
17:38
2026年2月4日下午,英伟达CEO黄仁勋在旧金山出席思科主办的AI会议时,公开反驳市场对‘AI将取代软件及工具’的担忧。他指出,AI发展高度依赖现有软件生态,而非另起炉灶,并强调‘这是世界上最不合逻辑的事情’。此番表态针对近期全球软件股因Anthropic新聊天机器人发布而引发的抛售潮。黄仁勋解释,AI最新突破聚焦于‘工具使用’,正因成熟软件具备明确、可...
17:38
2026年2月4日,中通快递宣布拟向非美国合格机构投资者发售总额15亿美元、2031年到期的可换股优先票据。本次发行依据美国1933年证券法S规例进行,具体条款将视市场情况等因素确定。此举旨在优化资本结构并支持公司长期发展战略。票据将以美元计价,可转换为公司A类普通股,转换价格等细节尚未披露。
17:38
2026年2月4日,宝马确认终止按月收费解锁座椅加热与方向盘加热服务。该订阅模式自2022年推出后引发强烈争议,一年内即被取消。宝马表示,失败主因是此类基础功能易引发用户反感。未来订阅重心将转向需持续云端通信与数据支持的高阶驾驶辅助系统(ADAS),硬件预装、软件后期在线解锁。宝马强调,不会通过付费解锁增加动力输出或提升续航,确保核心性能不设门槛。
17:38
2月4日,笨鸟速运在杭州总部召开2025年度工作复盘暨2026年度工作部署会议。公司总部职能部门负责人、直营省区及合伙人省区相关负责人参会。会议系统回顾了2025年运营成效与存在问题,并围绕网络优化、服务升级、数智化建设等重点任务部署2026年工作。此次会议旨在统一目标、压实责任,推动企业高质量发展。
17:38
2026年2月4日,星宸科技在互动平台回应投资者称,已就芯片价格动态调整与客户达成友好协商,并正逐步推进。此举基于当前行业供需格局变化、上游成本上升及各产品线市场差异。公司表示将根据成本波动、产品结构升级和客户需求,灵活优化定价策略,以保障供应链稳定及长期合作。相关调整尚未以正式公函对外公告。
17:38
2026年2月4日,德国汉高公司宣布以21亿欧元收购荷兰Stahl Holdings BV。交易涉及Wendel SE所持全部股份,以及巴斯夫、科莱恩等少数股东所持股份。Stahl专注于高性能合成皮革及纺织涂层解决方案,总部位于荷兰斯海尔托亨博斯。此次收购旨在强化汉高在可持续功能性材料领域的技术布局与全球供应链能力。交易尚需通过相关监管审批,预计于2026...
17:38
2月2日下午,河南中云嘲风飞行器有限公司与河南空中领航飞行器公司联合在孟州举行CF-Y50无人机首飞仪式及系统演练。该机搭载云征动力自主研发的转子发动机,满载50公斤时续航达400公里。首飞顺利完成全部预设动作,标志着河南大型无人机研发与实战应用取得突破。目前CF-Y50已获5架正式订单,数十架意向订单正洽谈中。‘嘲风’之名取自中华神话,寓意探索与守护。
17:38
2026年2月,生物技术服务商Ecovia Bio宣布完成B轮融资,由Pointe Angels领投。公司总部位于中国,专注于可持续发酵工艺生物聚合物的研发与商业化。其核心技术为天然可降解的γ-聚谷氨酸(γ-PGA),已应用于农业、化妆品及食品等领域。本轮融资将用于扩大γ-PGA中试产能、推进多条下游应用管线验证,并加速国内外注册与市场准入。此举旨在强化公...
17:35
在2026年春节联欢晚会的发布会上,中央广播电视总台(央视)宣布了一系列科技创新,将为观众带来前所未有的视听盛宴。此次春晚将在多个方面实现 “首次”,不仅在技术上突破,也在节目内容上进行大胆探索。首先,春晚将在制作中全面应用8K 超高清技术,并使用全国产化设备,确保画面质量的同时,提升观众的沉浸感。此外,央视最新研发的 “央视听媒体大模型2.0” 将首次应用...