谷歌Gemma 4大模型发布参数效率提升登顶开源排行榜第三

2026-04-03 10:02:26 互联网 4 次阅读

微新创想：谷歌DeepMind今天凌晨正式推出新一代开源大模型Gemma 4 该模型与谷歌闭源旗舰Gemini共享底层技术是时隔一年对Gemma 3的重大升级此次谷歌一改此前自有协议采用Apache 2.0商业友好型许可证开源开发者可无门槛自由修改分发和商用

谷歌一口气推出四款不同规格模型覆盖从手机边缘设备到工作站服务器的全场景部署在参数效率上表现亮眼 31B版本更是跻身Arena AI开源排行榜第三

Gemma 4的四款模型分为大模型组和小模型组各有针对性优化 31B Dense为310亿参数全激活架构 60层且拥有256K上下文窗口主打性能上限未量化权重可在单张80GB H100显卡运行量化后消费级显卡也能部署

26B A4B MoE采用混合专家架构 252亿总参数仅激活38亿推理速度接近4B模型性能却远超同级别列位开源排行榜第六延迟敏感场景性价比更高

小模型组的E4B和E2B主打端侧部署分别为80亿总参数（45亿有效） 51亿总参数（23亿有效）均配备128K上下文窗口 E2B内存占用可压至1.5GB以下且两款小模型搭载音频编码器支持语音识别与翻译大模型则专注视觉与文本能力无音频功能

所有模型均为多模态支持图像视频输入和140多种语言谷歌还与Pixel 高通联发科合作优化端侧 E2B/E4B可在手机树莓派等设备完全离线运行

相较于上一代Gemma 3 27B Gemma 4实现了代际级的性能提升尤其在代码领域进步最为显著 Codeforces ELO从110提升至2150 LiveCodeBench v6正确率从29.1%增至80.0%

数学方面 AIME 2026竞赛测试31B版本正确率达89.2% 远超上代20.8% 综合推理上研究生级科学问答GPQA Diamond正确率从42.4%升至84.3% MMLU Pro达85.2%

视觉和长上下文短板也被补齐 MMMU Pro多模态推理正确率提升至76.9% MRCR v2 128K长文档理解从13.5%增至66.4% 多语言能力也同步升级 MMMLU多语言测试达88.4%

此外 26B MoE与31B性能仅差2-5个百分点 E4B有效参数45亿性能却接近上代27B版本参数效率优势突出

Gemma 4还打造了多项核心能力全系列内置可开关的思考模式开启后先输出推理过程再给答案大幅提升数学逻辑等多步骤任务表现原生支持函数调用和结构化JSON输出可对接外部工具与API 谷歌还同步发布开源Agent开发框架ADK 端侧模型也能运行Agent

多模态处理上支持可变分辨率图片和60秒以内视频帧处理视觉token预算可手动调节适配不同速度与精度需求长文档处理采用混合注意力机制优化了内存占用兼顾处理效率与效果

2026年04月03日

12:08