谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三

微新创想:谷歌DeepMind今天凌晨正式推出新一代开源大模型Gemma 4 该模型与谷歌闭源旗舰Gemini共享底层技术 是时隔一年对Gemma 3的重大升级 此次谷歌一改此前自有协议 采用Apache 2.0商业友好型许可证开源 开发者可无门槛自由修改 分发和商用

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图1

谷歌一口气推出四款不同规格模型 覆盖从手机 边缘设备到工作站 服务器的全场景部署 在参数效率上表现亮眼 31B版本更是跻身Arena AI开源排行榜第三

Gemma 4的四款模型分为大模型组和小模型组 各有针对性优化 31B Dense为310亿参数全激活架构 60层且拥有256K上下文窗口 主打性能上限 未量化权重可在单张80GB H100显卡运行 量化后消费级显卡也能部署

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图2

26B A4B MoE采用混合专家架构 252亿总参数仅激活38亿 推理速度接近4B模型 性能却远超同级别 列位开源排行榜第六 延迟敏感场景性价比更高

小模型组的E4B和E2B主打端侧部署 分别为80亿总参数(45亿有效) 51亿总参数(23亿有效) 均配备128K上下文窗口 E2B内存占用可压至1.5GB以下 且两款小模型搭载音频编码器 支持语音识别与翻译 大模型则专注视觉与文本能力 无音频功能

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图3

所有模型均为多模态 支持图像 视频输入和140多种语言 谷歌还与Pixel 高通 联发科合作优化端侧 E2B/E4B可在手机 树莓派等设备完全离线运行

相较于上一代Gemma 3 27B Gemma 4实现了代际级的性能提升 尤其在代码领域进步最为显著 Codeforces ELO从110提升至2150 LiveCodeBench v6正确率从29.1%增至80.0%

谷歌Gemma 4大模型发布 参数效率提升登顶开源排行榜第三插图4

数学方面 AIME 2026竞赛测试31B版本正确率达89.2% 远超上代20.8% 综合推理上 研究生级科学问答GPQA Diamond正确率从42.4%升至84.3% MMLU Pro达85.2%

视觉和长上下文短板也被补齐 MMMU Pro多模态推理正确率提升至76.9% MRCR v2 128K长文档理解从13.5%增至66.4% 多语言能力也同步升级 MMMLU多语言测试达88.4%

此外 26B MoE与31B性能仅差2-5个百分点 E4B有效参数45亿 性能却接近上代27B版本 参数效率优势突出

Gemma 4还打造了多项核心能力 全系列内置可开关的思考模式 开启后先输出推理过程再给答案 大幅提升数学 逻辑等多步骤任务表现 原生支持函数调用和结构化JSON输出 可对接外部工具与API 谷歌还同步发布开源Agent开发框架ADK 端侧模型也能运行Agent

多模态处理上支持可变分辨率图片和60秒以内视频帧处理 视觉token预算可手动调节 适配不同速度与精度需求 长文档处理采用混合注意力机制 优化了内存占用 兼顾处理效率与效果

最新快讯

2026年04月03日

12:08
据媒体报道,微软正全速推进其自研尖端 AI 模型计划。该公司的目标极其宏大:在未来几年内打造出足以与 OpenAI 和 Anthropic 正面硬刚的前沿 AI 系统,并计划在 2027 年实现文本、图像和音频处理能力的行业全方位领先。战略“松绑”:从强力外援转向核心自主这一动作被视为微软 AI 战略的重大转折。自去年微软与 OpenAI 调整合作协议以来,...
12:08
具身智能领军企业**智元(AGIBOT)**于4月3日正式宣布,将于下周一(4月7日)开启为期六天的“智元AI发布周”(AGIBOT AI Week)。此次活动将以前所未有的密度,集中展示其在具身智能领域的一系列核心自研成果,旨在攻克行业痛点,推动物理AI的全面进化。针对当前具身智能产业普遍存在的“技术拼凑、落地断层”等挑战,智元计划在发布周期间,以“每日解...
12:08
4月3日,腾讯云正式推出针对智能体(Agent)的长期记忆服务“TencentDB Agent Memory”,旨在为OpenClaw等AI框架补齐长效记忆短板。该服务由腾讯云数据库团队研发,核心亮点在于构建了从原始对话到用户画像的“四层渐进式记忆系统”,实现了碎片化对话向结构化事实、场景化认知及个性化画像的深度转化。技术评测显示,接入该服务后,OpenCl...
12:08
近日,腾讯云正式发布了 “龙虾” 记忆服务 ——TencentDB Agent Memory,为其 OpenClaw 系统增添了强大的长期记忆能力。这项创新的记忆引擎由腾讯云数据库团队研发,采用了四层渐进式记忆系统,使 AI 助理能够更好地理解和记住用户的需求。Agent Memory 服务的推出,使 OpenClaw 的回答准确率达到了76.10%,相比原...
12:08
苹果研究团队与香港大学合作发布了一项名为 LGTM 的新渲染框架。这一框架的全称为 “Less Gaussians, Texture More”,旨在突破4K 超高清画质的渲染瓶颈。LGTM 框架的核心创新在于将3D 场景的几何结构与表面纹理进行解耦,从而简化几何形状的复杂性,同时通过叠加纹理层实现高质量的视觉效果。传统的 “前馈3D 高斯泼溅” 技术虽然可...
12:05
截至2026年4月1日,彭博社预测美国今年计划新建的数据中心近一半将延期或取消。主因是变压器、开关及储能电池等关键电力设备严重短缺。市场机构Sightline Climate指出,原定12GW投运规模中仅1/3项目在建。Crusoe能源负责人Andrew Likens强调,电力设备虽占建设成本不足10%,却是决定项目能否推进的基础设施瓶颈。为应对,行业正采...
12:05
2026年4月,AI用户研究服务商觅深科技宣布完成天使+轮融资,金额近千万美元。红杉中国种子基金领投,达晨创投、嘉程资本跟投。公司成立于2025年,核心产品为AI用户研究平台Mizzen Insight,服务出海电商、汽车科技、消费品牌及SaaS等领域客户。本轮融资将重点投入大模型能力优化、产品迭代与市场拓展。
12:05
2026年4月,睡眠科技企业夜合科技完成千万级人民币天使轮融资,投资方为顺为资本。该公司专注于OSA(阻塞性睡眠呼吸暂停)医疗级干预技术研发,主攻体外穿戴设备与智能闭环算法,致力于将专业医疗效果与无感、优雅的消费级体验相结合。本轮融资将用于核心算法迭代、临床验证推进及首款产品量产落地。公司总部位于中国,目前处于产品研发向商业化过渡阶段。
12:05
4月3日,顺丰中泰鲜花冷链专线在云南正式开通运营。该专线依托磨憨口岸实现鲜花直通曼谷,无需中转,达成“今日发货、隔日派送”时效。服务对象主要为云南鲜切花出口企业,旨在助力“云花”高效进入东南亚市场。顺丰计划本月底起每日发运,并逐步拓展至云南特色产品出口及泰国榴莲、山竹等农产品进口运输,构建中泰农产品双向冷链流通枢纽。
12:05
2026年4月,快手正式启动社会招聘专项“青锋计划”,面向工作年限3年以内的职场新人开放算法、工程、产品、运营、市场等岗位。该计划旨在强化高潜年轻人才引进与培养,覆盖入职、带教、培训到晋升全周期。公司为新人提供前辈带教、小班课程及高潜人才计划,并设每年两次晋升窗口。数据显示,过去三年新员工中近50%为0-3年经验者,算法岗达60%;入职满2年者晋升率达93...
12:05
2026年4月3日,研究人员披露针对英伟达RTX 3060和RTX 6000显卡的GDDRHammer与GeForge两种Rowhammer攻击。二者利用高频显存访问引发位翻转,篡改GPU页表,突破显存隔离,获取CPU内存完整读写权限,实现主机完全控制。攻击通过‘内存按摩’技术绕过驱动保护,其中GDDRHammer在RTX 6000上平均单存储体触发129...
12:05
微新创想:2026年4月,LG电子在加拿大官网正式推出新款39英寸5K2K OLED显示器39GX950B-B。这款显示器采用了1500R曲率的第四代Tandem OLED面板,不仅提升了视觉体验,还带来了更出色的色彩表现和对比度。其峰值亮度高达1500nits,能够呈现更加真实的画面细节,同时获得了VESA DisplayHDR True Black 50...