
微新创想:北京时间4月3日凌晨 谷歌正式发布开源大模型 Gemma4 凭借“单位参数智能”的突破性提升 定义了开源模型辅助智能体工作流的新标准
该系列包含高效版 E2B(2.3B)、E4B(4.5B) 以及高性能版26B MoE 与31B 稠密模型。作为基于 Gemini3 技术栈构建的最新成果 Gemma4 全系支持多模态输入(图片与视频) 其中 E2B 与 E4B 更是原生支持语音输入 实现了端侧实时的语音理解

技术架构上 大参数模型通过优化实现了极高的硬件效率 31B 稠密版在 Arena AI 文本榜单中位列开源模型全球第三 26B MoE 版位居第六 其逻辑推理与函数调用能力足以驱动复杂的自主智能体
在本地部署方面 Gemma4 显著降低了前沿 AI 能力的准入门槛 31B 模型的非量化权重可运行于单块80GB H100显卡 量化版则兼容消费级显卡 针对移动端与 IoT 设备 E2B 和 E4B 模型通过创新的 PLE 嵌入技术与128K 长上下文支持 在 Raspberry Pi 及智能手机上实现了低延迟的逻辑处理
此次发布不仅展示了谷歌在开源生态的深厚积淀 更通过 Apache2.0 协议的开放姿态 为全球开发者提供了构建本地化、高隐私性 AI 应用的底座
