
谷歌近日重磅发布了新一代AI模型Gemini 3,其中旗舰版本Gemini 3 Pro更是以惊人的1501 Elo分数强势刷新LMArena公开榜单历史最高纪录,一举超越了包括GPT-5.1、Claude 4.5与Grok-4.1在内的所有竞争对手,成功登顶目前评分最高的多模态模型宝座。这一突破性成就不仅彰显了谷歌在AI领域的领先地位,更标志着多模态AI技术迈入了全新纪元。
在性能表现方面,Gemini 3 Pro展现出全面而卓越的能力。在被誉为”人类终极考试”的MMLU测试中取得37.5%的优异成绩,在GPQA Diamond评测中更是高达91.9%,同时在MMMU-Pro与Video-MMMU测试中分别斩获81%与87.6%的卓越成绩。这些数据充分证明,Gemini 3 Pro在科学推理、数学计算以及视频理解等复杂任务上均具备超凡能力,展现了其在多领域应用的巨大潜力。
特别值得一提的是,Gemini 3 Pro搭载的增强推理模式Deep Think表现抢眼,将”人类终极考试”得分提升至41%,在ARC-AGI-2评测中更是取得45.1%的震撼成绩,一举刷新了通用智能评测的历史纪录。这一创新技术不仅大幅增强了模型的推理能力,更使其在复杂问题解决方面展现出接近人类的智能水平。
模型发布后,业界反响热烈。OpenAI CEO Sam Altman在X平台发文祝贺”Gemini3看起来很不错”,谷歌CEO Sundar Pichai则以一个简单的”🙏”表情符号回应。知名企业家Elon Musk更是在LMArena官方账号留言”确实值得祝贺”,并透露Grok 4.20版本即将发布,显示出业界对谷歌AI进展的高度认可。
然而,在一片赞誉声中,市场竞争的暗流也不容忽视。据Altman在随后流出的内部备忘录中坦言,谷歌的快速进展可能给OpenAI带来”暂时性经济阻力”,并提醒员工未来外界评价将”相当严峻”。这一表态清晰地反映出,Gemini3的强势表现已显著加剧了硅谷AI领域的竞争格局,未来或将迎来更加激烈的市场角逐。
