Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关

Nvidia 近期推出了一款备受瞩目的新型小型语言模型——Nemotron-Nano-9B-v2,凭借其在多项基准测试中的卓越表现和高度灵活的推理功能控制,迅速吸引了开发者和研究者的目光。这款模型的参数量精简至90亿,相较于前代120亿的规模实现了显著压缩,使其能够完美适配单个Nvidia A10 GPU的部署需求,为资源受限的环境提供了强大的AI解决方案。

Nvidia AI模型后训练总监Oleksii Kuchiaev特别强调,Nemotron-Nano-9B-v2是专为A10 GPU深度优化的产物,能够将处理速度提升高达6倍,充分展现了其在性能效率方面的突破性进展。该模型支持包括英语、德语、西班牙语、法语、意大利语、日语在内的多种语言,并扩展了韩语、葡萄牙语、俄语和中文等语种的覆盖,特别适用于指令跟随和代码生成等复杂任务场景。

Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关插图1

在技术架构上,Nemotron-Nano-9B-v2基于先进的Nemotron-H系列设计,创新性地融合了Mamba与Transformer的双重优势,在处理长序列信息时能够大幅降低内存消耗和计算压力。与传统的Transformer模型不同,Nemotron-H系列采用了革命性的选择性状态空间模型(SSM),在确保输出准确性的同时,实现了对更长信息序列的高效处理能力。

特别值得一提的是,Nemotron-Nano-9B-v2在推理功能控制方面实现了前所未有的灵活性。用户不仅可以默认获取推理过程的详细跟踪记录,还可以通过简单的控制指令如/think或/no_think随时切换这一功能。此外,模型内置了创新的运行时”思考预算”管理系统,允许开发者精确设定推理过程所允许的最大token数量,从而在准确性与响应速度之间实现理想的平衡。

基准测试结果有力证明了Nemotron-Nano-9B-v2的卓越性能。在使用NeMo-Skills套件的”推理开启”模式下,该模型在多项关键测试中均表现突出,其综合表现甚至超越了其他同类小型开源模型,充分彰显了Nvidia在模型优化方面的领先实力。

Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关插图2

在开源策略方面,Nvidia以极具吸引力的开放模型许可证发布了Nemotron-Nano-9B-v2,不仅允许商业用途,更赋予开发者完全的自由权去创建和分发衍生模型。尤为重要的是,Nvidia明确表示不会对模型生成的任何输出主张所有权,确保用户能够完全掌控其应用成果。这一举措标志着Nvidia在推动语言模型高效化与可控化发展道路上的坚定步伐。

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

? Nvidia 推出了新型小型语言模型 Nemotron-Nano-9B-v2,支持用户灵活控制推理功能。
⚙️ 该模型基于先进的混合架构,能够高效处理长序列信息,适用于多语言任务。
? Nemotron-Nano-9B-v2以开放模型许可证发布,允许开发者进行商业用途和衍生模型的创建。

最新快讯

2026年03月05日

13:55
微新创想:2026 年第一季度全球存储芯片市场迎来前所未有的价格波动 全球存储芯片市场在2026 年第一季度经历了一场剧烈的价格上涨。受人工智能数据中心对高性能存储需求的推动,DRAM 和 NAND 的价格涨幅远超市场预期。市场研究机构 TrendForce 最近调整了预测数据,原本预计 DRAM 在2026 年 Q1 合约价上涨 55%–60%,现在修正为...
13:35
微新创想:3月5日,默沙东公司正式宣布将关闭其位于美国北卡罗来纳州达勒姆的HPV疫苗生产线。这一决定影响了大约150名员工,他们将面临岗位调整或离职。此次停产是由于全球范围内HPV疫苗的需求出现下降,导致公司不得不采取产能优化措施。 默沙东表示,此次调整是为了确保其全球生产网络能够持续稳定地运行,并符合相关法规要求。公司指出,尽管生产线关闭,但在中国市场,H...
13:35
微新创想:2026年3月5日,哈萨克斯坦阿斯塔纳航空集团正式签署25架空客A320neo系列飞机确认订单。此次订单包括5架A320neo和20架A321neo。新机将由阿斯塔纳航空及其旗下的低成本航空公司飞狮航空共同运营。 微新创想:该集团目前已经运营了59架A320系列飞机。此次采购不仅有助于进一步扩大机队规模,还将显著提升其在区域航线上的运力。 微新创想...
13:35
微新创想:3月5日,阿曼石油营销公司一处燃料储存罐发生事故。事件发生在阿曼境内某运营地点,具体位置尚未公开。事故发生后,涉事公司迅速采取行动,立即启动了安全响应机制,并暂停了该地点的所有运营活动。公司方面表示,此次事故未造成人员伤亡,初步评估显示仅存在轻微的物理损坏,且没有泄漏或环境污染的迹象。目前,公司正积极配合相关部门进行详细调查,以查明事故原因并评估潜...
13:35
微新创想:2026年3月5日 苹果在英国及欧盟多国发售的2026款MacBook全系机型 包括MacBook Neo Air及Pro 均取消随附USB-C电源适配器 这一举措延续了苹果一贯的环保策略 与iPhone Apple Watch等产品保持一致 用户需要单独购买20W或更高功率的适配器 此次调整仅适用于欧洲市场 亚洲 北美等地的MacBook产品仍会...
13:35
微新创想:卡塔尔航空近日宣布将在阿曼马斯喀特和沙特利雅得两地启动有限疏运航班以接运滞留乘客 此次行动是为了解决近期由于航班运营调整而引发的旅客滞留问题 卡塔尔航空表示疏运服务将按照临时计划进行安排 具体的航班班次以及预订方式将由航空公司另行通知 目前尚未公布恢复正常运营的具体时间表
13:35
微新创想:3月5日,位于山西省的大吉煤岩气田年产能成功突破40亿立方米。这一成绩标志着我国在煤岩气开发领域迈出了重要一步,大吉煤岩气田作为我国首个实现规模开发的煤岩气田,其平均埋深达到2130米,探明地质储量高达4000亿立方米,展现出巨大的开发潜力。 今年大吉煤岩气田持续推进勘探开发工作,新增钻井16口,进一步提升了产能。通过持续的技术优化和资源勘探,新增...
13:35
微新创想:2026年3月5日,兴业银锡在互动平台回应投资者提问称,截至2024年末,公司旗下各矿采矿许可证范围内铟金属保有储量为1130.7吨 公司表示,铟作为伴生稀有金属,主要随锌、锡等主金属冶炼过程综合回收 当前暂无独立铟金属产线建设计划 此举系基于现有资源禀赋、技术路径及市场供需综合考量
13:35
微新创想:3月5日,成都—厦门“丝路海运”铁海联运专列从成都城厢站首发,驶往厦门前场站。该专列由成都国际铁路港负责运营,满载机电产品、农副产品及汽车配件等多种货物。在抵达厦门港后,货物将进行换装并搭乘国际班轮,直接运往越南、泰国等东南亚国家。这一运输方式实现了铁路、港口与海运之间的无缝衔接,大幅提升了物流效率。 微新创想:此次铁海联运专列的开通,标志着四川地...
13:35
微新创想:2026年3月5日,伟星股份在投资者关系活动中表示,近期铜等大宗商品价格大幅上涨,对公司原材料成本造成一定压力。公司采用成本加成定价模式,通过动态把握采购时机、优化库存管理,并加快新材料、新工艺研发,积极应对成本上升影响。上述措施旨在稳定产品价格与盈利能力,缓解上游涨价传导压力。
13:35
微新创想:3月5日,鸿蒙智行旗下尊界S800轿车正式发布并开启下定。这款新车在智能驾驶和整车性能方面实现了重大突破,搭载新一代896线双光路图像级激光雷达,能够实现更精准的环境感知和更高级别的自动驾驶能力。全车配备36个传感器,构建了全向立体融合感知系统,为车辆的安全性和智能化提供了坚实保障。 微新创想:尊界S800提供四座与五座两种布局,满足不同用户对空间...
12:54
声明:本文来自于微信公众号 亿邦动力,作者:姜琪,授权站长之家转载发布。十万成本,四天时间,换来亿级曝光。去年秋天,AI漫剧《洪荒:代管截教,忽悠出了一堆圣人》首播,爆了。89集,没有真人演员,没有实景拍摄,全部由算法逐帧生成,风格在动态漫画与动画之间。《洪荒》制作方是酱油文化,商务负责人叫颜四海,他觉得”这个行业好像产生了一个...