Nvidia 近期正式推出了新一代小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型技术正迎来新一轮发展热潮。这款模型拥有9亿个参数,虽然相较于百万级参数的微型模型规模更大,但较其原始的12亿参数版本已大幅精简,核心目标是在Nvidia A10 GPU上实现高效运行。Nvidia AI模型后训练总监Oleksii Kuchiaev在社交平台上强调,参数缩减是为了更好地满足实际部署需求,同时该模型创新性地采用了混合架构,在处理大批量数据时性能提升显著,比同等规模的变换模型速度快达6倍。
Nemotron-Nano-9B-v2具备多语言支持能力,涵盖英语、德语、西班牙语、法语、意大利语、日语等多种语言,特别适用于指令跟随和代码生成等应用场景。其设计中最具创新性的是引入了用户可控的推理机制——用户可以通过简单的控制令牌来切换AI的”思考”过程,即在生成答案前是否进行自我检查。系统默认会保留推理痕迹,但用户可通过如/think或/no_think等命令灵活控制此过程。此外,模型还建立了”思考预算”管理机制,允许开发者精确设定推理过程中使用的标记数量,从而在准确性与响应速度之间实现最佳平衡。
多项基准测试结果印证了Nemotron-Nano-9B-v2的卓越性能。在”推理开启”模式下,该模型在AIME25、MATH500、GPQA和LiveCodeBench等权威测试中均表现出色。同时,在指令跟随和长上下文基准测试中同样展现出超越其他开放小型模型的准确度。Nvidia特别为这款模型提供了开放许可协议,允许开发者在商业环境中自由使用和分发,并明确声明不对模型生成的任何内容主张所有权。这一举措彻底打破了传统模型使用的门槛和费用顾虑,使企业能够立即将模型投入生产应用。
Nvidia Nemotron-Nano-9B-v2模型为需要在小规模设备上实现高效推理能力的开发者提供了理想解决方案。其创新的运行预算控制和推理切换功能,为系统构建者提供了前所未有的灵活性,能够根据实际需求动态调整准确性与响应速度的平衡点,必将进一步推动小型语言模型技术的普及与发展。划重点:🌟 Nemotron-Nano-9B-v2是Nvidia全新推出的9亿参数小型语言模型,专为高效部署场景设计。🧠 模型支持多语言并具备可切换的推理功能,让用户能够根据具体需求调整AI响应方式。📈 开放许可协议确保开发者可无限制使用和分发模型,彻底消除商业应用中的费用和许可障碍。