谷歌 DeepMind 人工智能研究团队近日正式推出了一款名为 Gemma3270M 的开源 AI 模型,为开发者带来轻量级却功能强大的智能解决方案。这款模型拥有2.7亿个参数,在参数数量上虽不及许多700亿以上的先进大语言模型,但其精巧的设计使其在体积和运行效率上展现出显著优势。
Gemma3270M 的核心目标是为开发者提供一种高效且便捷的模型,使其能够直接在智能手机上离线运行。在内测阶段,该模型在 Pixel9Pro SoC 上的表现尤为突出,证明了其在移动设备上的强大适应性。谷歌 DeepMind 的工程师表示,Gemma3270M 不仅可以在用户的网络浏览器中流畅运行,甚至能够在树莓派及一些轻量级硬件平台上使用,极大地拓宽了其应用场景。
在模型架构上,Gemma3270M 结合了1.7亿个嵌入参数和1亿个变换块参数,并配备了一个256k的词汇量,使其能够高效处理稀有和特定的词汇。这种设计不仅提升了模型的灵活性,也增强了其在特定领域任务中的表现能力。根据谷歌的官方数据,Gemma3270M 在指令跟随任务上的表现相当出色,在 IFEval 基准测试中取得了51.2分的优异成绩,超越了众多同类小型模型。
在能效方面,Gemma3270M 也表现出色。内部测试显示,当使用 INT4量化模型时,该模型在 Pixel9Pro SoC 上仅消耗了0.75%的电池电量,这一数据充分证明了其在移动设备上的低功耗特性。这种高效的能效表现,使得开发者可以更加放心地将模型部署到各种资源受限的设备上。
Gemma3270M 不仅适用于企业开发,也适合创造性场景。谷歌在 YouTube 上展示了一款基于该模型的“睡前故事生成器”应用,这款应用能够在不连接网络的情况下生成多样化的故事,为用户带来全新的互动体验。此外,Gemma3270M 在 Gemma 生态系统中与其他大型模型兼容,并配备了丰富的文档和微调指南,开发者能够迅速从实验过渡到部署,大大降低了使用门槛。
根据 Gemma 使用条款,该模型完全开源,允许开发者在遵循一定条件的前提下进行使用、修改和分发,且生成的内容不归谷歌所有。随着 Gemma 系列的下载量突破两亿,谷歌 AI 开发者正致力于将 Gemma3270M 打造成为构建快速、高效且关注隐私的 AI 解决方案的基础,为全球开发者提供更多可能性。
项目:https://developers.googleblog.com/en/introducing-gemma-3-270m/
划重点:
? Gemma3270M 是谷歌发布的开源 AI 模型,拥有2.7亿个参数,可在智能手机上离线运行。
⚡ 该模型在指令跟随任务上表现出色,能效高,内部测试显示仅消耗0.75% 电池电量。
? Gemma3270M 支持快速微调,适用于企业开发和创造性应用,满足多样化需求。