
微新创想:谷歌DeepMind今天凌晨正式推出新一代开源大模型Gemma 4 该模型与谷歌闭源旗舰Gemini共享底层技术 是时隔一年对Gemma 3的重大升级 此次谷歌一改此前自有协议 采用Apache 2.0商业友好型许可证开源 开发者可无门槛自由修改 分发和商用

谷歌一口气推出四款不同规格模型 覆盖从手机 边缘设备到工作站 服务器的全场景部署 在参数效率上表现亮眼 31B版本更是跻身Arena AI开源排行榜第三
Gemma 4的四款模型分为大模型组和小模型组 各有针对性优化 31B Dense为310亿参数全激活架构 60层且拥有256K上下文窗口 主打性能上限 未量化权重可在单张80GB H100显卡运行 量化后消费级显卡也能部署

26B A4B MoE采用混合专家架构 252亿总参数仅激活38亿 推理速度接近4B模型 性能却远超同级别 列位开源排行榜第六 延迟敏感场景性价比更高
小模型组的E4B和E2B主打端侧部署 分别为80亿总参数(45亿有效) 51亿总参数(23亿有效) 均配备128K上下文窗口 E2B内存占用可压至1.5GB以下 且两款小模型搭载音频编码器 支持语音识别与翻译 大模型则专注视觉与文本能力 无音频功能

所有模型均为多模态 支持图像 视频输入和140多种语言 谷歌还与Pixel 高通 联发科合作优化端侧 E2B/E4B可在手机 树莓派等设备完全离线运行
相较于上一代Gemma 3 27B Gemma 4实现了代际级的性能提升 尤其在代码领域进步最为显著 Codeforces ELO从110提升至2150 LiveCodeBench v6正确率从29.1%增至80.0%

数学方面 AIME 2026竞赛测试31B版本正确率达89.2% 远超上代20.8% 综合推理上 研究生级科学问答GPQA Diamond正确率从42.4%升至84.3% MMLU Pro达85.2%
视觉和长上下文短板也被补齐 MMMU Pro多模态推理正确率提升至76.9% MRCR v2 128K长文档理解从13.5%增至66.4% 多语言能力也同步升级 MMMLU多语言测试达88.4%
此外 26B MoE与31B性能仅差2-5个百分点 E4B有效参数45亿 性能却接近上代27B版本 参数效率优势突出
Gemma 4还打造了多项核心能力 全系列内置可开关的思考模式 开启后先输出推理过程再给答案 大幅提升数学 逻辑等多步骤任务表现 原生支持函数调用和结构化JSON输出 可对接外部工具与API 谷歌还同步发布开源Agent开发框架ADK 端侧模型也能运行Agent
多模态处理上支持可变分辨率图片和60秒以内视频帧处理 视觉token预算可手动调节 适配不同速度与精度需求 长文档处理采用混合注意力机制 优化了内存占用 兼顾处理效率与效果
