
IBM AI 团队近日重磅推出全新小型模型家族——Granite4.0Nano 系列,专为本地和边缘推理场景量身打造。这一创新系列旨在赋予企业更强大的模型控制能力,并全面采用开源 Apache2.0 许可,为企业级 AI 应用开发提供理想解决方案。该系列共包含8款精心设计的模型,依据350M和约1B两种规模划分,均采用先进的混合 SSM(状态空间模型)与变换器架构,同时支持基础推理和指令微调两种运行模式。
所有模型均可在vLLM、llama.cpp和MLX等主流运行时环境中无缝部署,确保跨平台兼容性。Granite4.0Nano 系列涵盖四条核心模型线及其基础版本,其中 Granite4.0H1B 模型基于混合 SSM 架构设计,参数量高达1.5B,而 Granite4.0H350M 模型则采用相同混合方法,参数量精确控制在350M。为提升运行时环境兼容性,IBM 特别提供了 Granite4.01B 和 Granite4.0350M 的纯变换器版本。这些 H 变体模型通过交替使用 SSM 层和变换器层,在内存效率方面展现出显著优势,既保持了变换器模块的通用性,又有效降低了资源消耗。
在训练方法上,Granite4.0Nano 系列严格遵循与大规模 Granite4.0 模型相同的标准流程,累计使用超过15万亿个标记进行深度训练,并经过专业指令微调,显著提升了工具使用能力和指令遵循精度。性能测试结果显示,该系列模型在通用知识、数学推理、代码生成及安全性评估等多个维度均表现卓越,甚至超越 Qwen、Gemma 和 LiquidAI LFM 等同类竞争模型。特别是在代理任务领域,Granite4.0Nano 在 IFEval 和伯克利函数调用排行榜第3版中位列前三,充分验证了其实用价值。

企业级应用保障方面,所有模型均通过 ISO42001 国际认证,并以加密签名形式发布,确保企业级使用场景下的可追溯性和治理合规。用户可通过 Hugging Face 和 IBM watsonx.ai 两大平台便捷获取这些模型,支持边缘设备、本地服务器和浏览器环境的多场景部署,为早期 AI 工程师和软件开发团队提供强大助力。huggingface:https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models
划重点:
🔹 IBM 发布了 Granite4.0Nano 系列,包含8个模型,专为边缘 AI 推理场景优化。
🔹 该系列模型基于超过15万亿个标记进行训练,完美继承大规模 Granite4.0 模型的性能优势。
🔹 所有模型均通过 ISO42001 认证,具备企业级治理能力,支持跨平台原生运行,可广泛应用于各类商业场景。
