谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三

微新创想:谷歌DeepMind今天凌晨正式推出新一代开源大模型Gemma 4 该模型与谷歌闭源旗舰Gemini共享底层技术 是时隔一年对Gemma 3的重大升级 此次谷歌一改此前自有协议 采用Apache 2.0商业友好型许可证开源 开发者可无门槛自由修改 分发和商用

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图1

谷歌一口气推出四款不同规格模型 覆盖从手机 边缘设备到工作站 服务器的全场景部署 在参数效率上表现亮眼 31B版本更是跻身Arena AI开源排行榜第三

Gemma 4的四款模型分为大模型组和小模型组 各有针对性优化 31B Dense为310亿参数全激活架构 60层且拥有256K上下文窗口 主打性能上限 未量化权重可在单张80GB H100显卡运行 量化后消费级显卡也能部署

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图2

26B A4B MoE采用混合专家架构 252亿总参数仅激活38亿 推理速度接近4B模型 性能却远超同级别 列位开源排行榜第六 延迟敏感场景性价比更高

小模型组的E4B和E2B主打端侧部署 分别为80亿总参数(45亿有效) 51亿总参数(23亿有效) 均配备128K上下文窗口 E2B内存占用可压至1.5GB以下 且两款小模型搭载音频编码器 支持语音识别与翻译 大模型则专注视觉与文本能力 无音频功能

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图3

所有模型均为多模态 支持图像 视频输入和140多种语言 谷歌还与Pixel 高通 联发科合作优化端侧 E2B/E4B可在手机 树莓派等设备完全离线运行

相较于上一代Gemma 3 27B Gemma 4实现了代际级的性能提升 尤其在代码领域进步最为显著 Codeforces ELO从110提升至2150 LiveCodeBench v6正确率从29.1%增至80.0%

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图4

数学方面 AIME 2026竞赛测试31B版本正确率达89.2% 远超上代20.8% 综合推理上 研究生级科学问答GPQA Diamond正确率从42.4%升至84.3% MMLU Pro达85.2%

视觉和长上下文短板也被补齐 MMMU Pro多模态推理正确率提升至76.9% MRCR v2 128K长文档理解从13.5%增至66.4% 多语言能力也同步升级 MMMLU多语言测试达88.4%

此外 26B MoE与31B性能仅差2-5个百分点 E4B有效参数45亿 性能却接近上代27B版本 参数效率优势突出

Gemma 4还打造了多项核心能力 全系列内置可开关的思考模式 开启后先输出推理过程再给答案 大幅提升数学 逻辑等多步骤任务表现 原生支持函数调用和结构化JSON输出 可对接外部工具与API 谷歌还同步发布开源Agent开发框架ADK 端侧模型也能运行Agent

多模态处理上支持可变分辨率图片和60秒以内视频帧处理 视觉token预算可手动调节 适配不同速度与精度需求 长文档处理采用混合注意力机制 优化了内存占用 兼顾处理效率与效果

最新快讯

2026年04月03日

11:04
2026年4月2日,微软正式推出自研语音转录模型MAI-Transcribe-1。该模型在FLEURS基准测试(覆盖25种语言)中实现3.9%平均字错误率,宣称全球最精准。其在11种核心语言排名榜首,性能超越Whisper-large-v3及Gemini 3.1 Flash。转录速度达Azure Fast服务的2.5倍,定价仅0.36美元/小时,为当前主流...
11:04
2026年4月3日上午,极氪汽车发布极氪001五周年纪念版车型配置。该车将于4月10日限量上市,基于900V高压架构打造,最大马力925匹,零百加速2.91秒,最高时速280公里。搭载103度麒麟电池,CLTC续航680公里,支持6C快充,10%-80%仅需10分钟。配备KW绞牙避震、Brembo六活塞卡钳、22英寸锻造轮毂及P ZERO轮胎,并搭载FR-...
11:04
4月3日,Web3基础设施服务商Pumpcade宣布完成100万美元Pre-Seed轮融资。本轮融资由Pump.fun领投,Foundation Capital和天使投资人RadioSolace跟投。该公司专注于直播场景内嵌的极速预测市场,提供60秒超短期预测与微投注服务。融资将用于加速产品开发、扩大技术团队及深化直播平台生态集成。总部位于新加坡,团队核心...
11:04
4月1日,Triumph Higher Education Group正式完成对加拿大PICA Holdings Incorporated的收购。PICA Holdings是位于温哥华的专业烹饪与糕点艺术教育机构Pacific Institute of Culinary Arts(PICA)的母公司。此次收购将PICA纳入Triumph旗下烹饪教育体系,与...
11:03
2026年至2029年,微软将在日本投资100亿美元建设数据中心及相关基础设施。此举旨在响应日本企业及政府对云计算与AI算力的快速增长需求,强化本地云服务覆盖与数据合规能力。投资将分阶段实施,涵盖东京、大阪等核心区域,预计创造数百个高技能就业岗位。项目由微软日本公司主导,已与多家本地合作伙伴展开前期协调。
11:03
4月3日,A股算力租赁概念局部走强,思特奇、直真科技双双涨停。消息源于工信部4月2日发布《普惠算力赋能中小企业发展专项行动通知》,明确推进算力服务普惠供给,首次提出探索“算力银行”“算力超市”等创新模式,支持中小企业跨区域、跨周期调度闲置算力资源。该政策旨在降低中小企业用算门槛,提升算力资源利用效率。东方国信、光环新网等跟涨。
11:03
微新创想:2026年4月3日,强制性国家标准GB 47372-2026《移动电源安全技术规范》正式发布。该标准由工业和信息化部组织制定,适用于充电宝及户外电源等便携式移动电源。新规强化电池本质安全,新增针刺试验与循环老化检测,并首次要求产品明确标注建议安全使用年限。标准设12个月过渡期,期满后所有产品须符合新要求。此前合规购入的旧款充电宝,只要符合民航现行规...
11:03
微新创想:2026年4月3日,英中商业发展中心(CUKBDC)与澄世咨询(Transphere Consulting)在伦敦和北京同步宣布成立China Going Global Alliance(CGGA) 该联盟旨在为中国企业提供端到端国际拓展支持,涵盖战略路径设计、政府对接、投资架构与选址、产业及资本合作、投后运营协同等关键环节 CGGA面向面临复杂国...
11:03
微新创想:4月3日,海光信息在2026年春季技术沟通会上正式发布DCU软件栈年度版本。此次发布地点为北京,发布主体为海光信息技术股份有限公司。新版本基于‘内生安全’理念,依托硬件架构自主创新,通过拓展安全算法指令、集成安全处理器等方式,原生支持密码技术、机密计算、可信计算及漏洞防御。此举旨在提升AI应用的安全性与运行效率,强化国产算力平台的安全底座能力。
11:03
微新创想:Canonical近日宣布Ubuntu 26.04 LTS(代号Resolute Raccoon)将首次自2019年以来调整最低运行内存要求。根据官方公告,该版本的最低内存需求从4GB提升至6GB。这一变化意味着用户在选择设备运行Ubuntu 26.04 LTS时需要考虑更高的硬件配置。 Ubuntu 26.04 LTS的发布日期预计为2026年4...
11:03
微新创想:2026年4月3日,小米发布公告称,受全球存储芯片等关键零部件价格大幅上涨影响,自4月11日0时起调整部分Redmi在售机型建议零售价。此次价格调整主要针对部分热门产品,以应对不断上升的供应链成本。 涉及机型包括Redmi K90 Pro Max,该机型建议零售价将上调200元。同时,Turbo 5及Turbo 5 Max两款产品取消新春特惠活动,...
11:02
微新创想:4月2日,四川发生了一件让人又好气又好笑的事儿。当天,家里两只狗不知为啥突然大打出手,在屋里闹得不可开交。两只狗在客厅里来回奔跑,互相撕咬,场面一度十分混乱。 而坐在沙发上的女主人完全没反应过来,就成了这场“狗战”的无辜受害者,被其中一只狗给咬了一口。这突如其来的一幕,把女主人疼得直咧嘴,她一边揉着被咬的地方,一边惊讶地望着两只狗。 这时,女子的妈...