
微新创想:4月3日凌晨,Google DeepMind 正式发布新一代开源模型系列 Gemma4。此次更新距离上一代产品发布整整一年,谷歌不仅在性能上实现了“代际跨越”,更在开源诚意上放出了大招:将许可证由自有协议彻底更换为全球通用的 Apache2.0,这意味着开发者可以更自由地进行商用与二次开发。
微新创想:规格全覆盖:从手机端到工作站的“四剑客”Gemma4 此次一口气推出了四款不同规格的模型,实现了全场景覆盖。31B Dense(旗舰版):310亿全激活参数,支持256K 超长上下文。在 Arena AI 开源排行榜中高居第三,未量化版本仅需一张 H100 即可运行。

微新创想:26B A4B MoE(性价比之王):采用混合专家架构,总参数252亿,激活参数仅为38亿。其推理速度接近4B 模型,但质量远超同级别产品,位列排行榜第六。
微新创想:E4B & E2B(端侧精英):专为手机和嵌入式设备优化。通过 Per-Layer Embeddings 技术,有效参数分别压缩至45亿和23亿。其中 E2B 在部分设备上的内存占用可压至1.5GB 以下。
微新创想:性能狂飙:代码与数学能力实现代际飞跃。相比上一代 Gemma327B,Gemma4 的核心指标提升堪称惊人。数学竞赛:AIME2026 测试从20.8% 飙升至 89.2%。编程进化:Codeforces ELO 评分从110 拉升至 2150,在 LiveCodeBench 测试中从29.1% 涨至80.0%,成为目前最可用的开源编程辅助模型之一。

微新创想:综合推理:研究生级科学问答(GPQA Diamond)得分从42.4% 几乎翻倍至 84.3%。多语言能力:原生支持140多种语言,MMMLU 评分达88.4%。
微新创想:核心特性:内置“思考模式”与 Agent 基因。Gemma4 不仅仅是参数的增长,更在交互逻辑上向旗舰 Gemini 看齐。Thinking Mode:内置可开关的思考模式,模型在输出答案前会先进行内部推理,极大提升了多步骤规划类任务的准确性。
微新创想:原生 Agent 支持:支持函数调用和结构化 JSON 输出。谷歌同步发布了开源 Agent 开发工具包(ADK),让端侧模型也能变身“智能体”。

微新创想:深度多模态:所有版本均支持图像和视频输入,小模型版本甚至额外自带了音频编码器,支持语音识别与翻译。
微新创想:行业观察:开源赛道的“权力重组”。在过去的一年里,国内开源模型(如 DeepSeek、Qwen、GLM 等)迭代极快,谷歌在开源领域的影响力一度被削弱。Gemma4 的发布,标志着谷歌正通过“极致的端侧工程化”与“更彻底的协议开放”重回主战场。
微新创想:结语:当大厂开始讲“诚意”从自定义协议转向 Apache2.0,谷歌用实际行动回答了开源诚意的问题。当31B 规模的模型能跑出接近闭源旗舰的性能,且能流畅运行在消费级显卡甚至手机上时,全球 AI 开发者的创作边界将再次被拓宽。
