Gemini-3-Pro断层领先多模态评测 豆包商汤国产阵营强势崛起Qwen3-VL成首个开源高分模型

全球多模态大模型竞争格局迎来全新洗牌。权威评测平台SuperCLUE-VLM近日发布了2025年12月多模态视觉语言模型综合榜单,谷歌Gemini-3-Pro以83.64分的惊人成绩独占鳌头,充分展现了其在视觉理解与推理领域的绝对领先地位。字节跳动豆包大模型以73.15分的优异表现强势跻身前三甲,商汤科技SenseNova V6.5Pro则以75.35分的成绩位列第二,国产大模型整体表现令人瞩目,彰显了中国AI在多模态赛道上的快速崛起能力。

SuperCLUE-VLM从三大核心维度全面评估模型的视觉理解能力:基础认知、视觉推理和视觉应用。基础认知主要考察模型识别图像中的物体、文字、场景等基本元素的能力;视觉推理则测试模型理解图像逻辑、因果关系与隐含信息的深度;视觉应用则衡量模型完成图文生成、跨模态问答、工具调用等实际任务的效能。

Gemini-3-Pro在所有评测维度中均表现卓越,全面碾压竞争对手:基础认知得分高达89.01分,视觉推理能力达到82.82分,视觉应用能力亦为79.09分。其综合表现远超其他竞品,进一步巩固了谷歌在多模态领域的技术霸主地位。国产阵营同样表现抢眼,商汤SenseNova V6.5Pro以75.35分的成绩稳居第二,展现出均衡的推理与应用能力;字节跳动豆包大模型以73.15分位列第三,基础认知得分高达82.70,甚至超越部分国际模型,仅在视觉推理环节略有不足;百度ERNIE-5.0-Preview与阿里Qwen3-VL紧随其后,均进入前五。特别值得一提的是,Qwen3-VL成为榜单中首个总分突破70分的开源多模态模型,为全球开发者提供了高性能、可商用的开放基座。

Gemini-3-Pro断层领先多模态评测 豆包商汤国产阵营强势崛起Qwen3-VL成首个开源高分模型插图1

在国际巨头中,Anthropic的Claude-opus-4-5以71.44分位居中上游,延续了其在语言理解方面的优势;而OpenAI的GPT-5.2(高配置版本)仅获得69.16分,排名相对靠后,引发了业界对其多模态能力优化方向的广泛讨论。

AIbase观察指出,SuperCLUE-VLM榜单不仅是一份技术排名,更折射出行业发展趋势:开源模型正强势崛起,Qwen3-VL的成功证明开源路线同样可以实现高性能,有力推动技术民主化进程;国产模型更加聚焦场景落地,豆包、商汤等模型在基础认知上表现优异,高度契合中文互联网图文理解、短视频分析等高频需求;视觉推理能力仍是行业瓶颈,多数模型在复杂逻辑、因果推断等高阶任务上仍有明显差距,这也是Gemini持续领先的关键因素。随着多模态能力成为AI Agent、智能座舱、AR/VR等下一代应用的核心支撑,这场“看图说话”的竞赛,正决定谁将真正“看见”并理解世界。而中国大模型,已在通往全球第一梯队的道路上加速奔跑。

最新快讯

2025年12月31日

14:16
在人工智能对话技术深刻改变用户获取信息与消费决策的今天,品牌在AI模型中的形象已成为决定市场成败的关键因素。面对这一变革浪潮,AIBase公司推出的“GEO Base”品牌监控系统(https://geo.aibase.com/),为企业开辟了一条精准掌控AI认知、实现品牌价值跃升的创新路径。 传统搜索引擎时代,品牌主要通过关键词优化争夺曝光机会。然而,...
14:16
微新创想12月31日消息,今日,OPPO Reno15全新配色星星粉正式开售,售价2999元起。星星粉行业首发星闪光栅工艺,机身微转后星星也随之变幻。OPPO Reno15于今年11月发布,带来Reno15与Reno15 Pro两款机型,全系配备由2亿像素超清主摄、5000万像素潜望长焦、5000万像素超广角及前置5000万超广...
14:16
2024年12月30日,北交所官网披露尚睿科技股份有限公司招股说明书(申报稿),其上市申请已获正式受理。尚睿科技拟向不特定合格投资者公开发行股票不超过5,231,988股(未行使超额配售权)或6,016,786股(全额行使)。公司专注于消费类自主品牌产品的研发、设计与销售,覆盖功能性服饰、数码科技、家居生活及创客硬件领域,依托跨境电商平台深耕十余年,致力于...
14:16
2024年12月30日,广东凯得智能科技股份有限公司的上市之路迎来关键进展,其申报材料已获北交所正式受理。根据公告,公司计划发行不超过1800万股股票,由光大证券担任保荐机构,标志着其距离资本市场更近一步。 凯得智能专注于精准控温控湿技术的研发与应用,产品线覆盖葡萄酒冷藏柜、医疗柜、嵌入式冰箱等高端制冷设备。公司已成功构建覆盖常温至超低温的全温区技术体系...
14:15
2025年12月30日至2026年1月5日,微星官方在多个平台上的MSI Gaming社媒头图悄然更换为“天气预报”系列创意设计。这一系列视觉元素中,特别值得注意的是1月5日当天展示的“闪电”图标,它似乎在向外界传递一个强烈信号——微星可能在即将到来的CES 2026展会正式发布新一代LIGHTNING系列旗舰显卡。回顾历史,该系列上一代产品RTX 2080...
14:15
2025年12月31日,特斯拉宣布Model Y连续第三年成为全球最畅销汽车。尽管当年第一季度因四大工厂产线升级导致生产中断,销量短期承压,但全年表现依然强劲。该车型自2023年起超越丰田RAV4、卡罗拉等传统燃油车霸主,稳居榜首。特斯拉在年度总结中强调了这一里程碑,马斯克也在社交平台发文确认。新款Model Y于2025年在全球陆续推出,巩固了其市场领先...
14:15
2025年12月31日,印尼东爪哇省塞梅鲁火山发生喷发。当地时间6时29分,火山灰柱高达约900米,持续喷发时间为125秒。此次喷发由印尼火山地质减灾中心监测确认,暂无人员伤亡报告。相关部门已加强周边区域监测与疏散准备。
14:15
12 月 30 日,有消息传出,快手科技副总裁、基础大模型及推荐模型负责人周国睿即将离职。这一消息来自多个独立信源,令人关注的是,周国睿可能会选择加入 Meta(脸书母公司)或 TikTok(抖音国际版)。据了解,目前他在公司内部的状态显示为休假,并且他的电子邮件签名已变更为 “Log Out”,似乎暗示着他即将踏上新的职业旅程。周国睿拥有丰富的技术背景,他...
14:15
2026年“两新”政策迎来重大突破性升级,标志着智能化终端正式纳入普惠性消费支持体系。根据央视新闻报道,国家在原有汽车、家电、数码产品补贴政策基础上,**创新性地将智能眼镜、智能家居产品(含适老化家居)首次纳入“以旧换新”补贴范围**,这一举措将显著加速智能化终端的普及进程。 最新政策细则显示,个人消费者购买四类数码与智能产品——手机、平板、智能手表(含手环...
14:15
在科技行业竞争白热化的今天,OpenAI 的薪酬策略成为业界焦点。最新财务报告揭示,这家全球领先的人工智能巨头向约 4000 名员工发放的股票薪酬人均高达 150 万美元,这一数字创下科技初创公司历史新高。更令人惊叹的是,该数据是过去 25 年间其他 18 家主要科技企业上市前一年员工薪酬的 34 倍,充分彰显了 OpenAI 在人才激励上的雄心。 据深度分...
14:15
谷歌的 Nano Banana AI 工具近日引发了广泛的隐私争议,其核心问题在于该工具可能对全球15亿用户的照片进行大规模分析与存储。据《福布斯》报道,专注于隐私保护的科技公司 Proton 指控谷歌在其照片存储服务 Google Photos 中,未经用户同意便利用这些照片为 AI 系统提供数据。这一指控并非来自监管机构或内部人士,而是直接来自与谷歌在云...
14:15
近年来,众多企业纷纷投身于人工智能(AI)工具的试点与测试,积极探索最适宜自身发展的应用策略。随着实践的不断深入,一个重要的转折点正在显现——投资者普遍认为,企业对AI的实验探索阶段即将告一段落。据预测,到2026年,企业对AI的投入将迎来显著增长,但资金分配将更加聚焦于少数几个经过验证的高效供应商。多位专注于企业级风险投资的投资专家指出,2026年将成为企...