Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关

Nvidia 近期推出了一款备受瞩目的新型小型语言模型——Nemotron-Nano-9B-v2,凭借其在多项基准测试中的卓越表现和高度灵活的推理功能控制,迅速吸引了开发者和研究者的目光。这款模型的参数量精简至90亿,相较于前代120亿的规模实现了显著压缩,使其能够完美适配单个Nvidia A10 GPU的部署需求,为资源受限的环境提供了强大的AI解决方案。

Nvidia AI模型后训练总监Oleksii Kuchiaev特别强调,Nemotron-Nano-9B-v2是专为A10 GPU深度优化的产物,能够将处理速度提升高达6倍,充分展现了其在性能效率方面的突破性进展。该模型支持包括英语、德语、西班牙语、法语、意大利语、日语在内的多种语言,并扩展了韩语、葡萄牙语、俄语和中文等语种的覆盖,特别适用于指令跟随和代码生成等复杂任务场景。

Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关插图1

在技术架构上,Nemotron-Nano-9B-v2基于先进的Nemotron-H系列设计,创新性地融合了Mamba与Transformer的双重优势,在处理长序列信息时能够大幅降低内存消耗和计算压力。与传统的Transformer模型不同,Nemotron-H系列采用了革命性的选择性状态空间模型(SSM),在确保输出准确性的同时,实现了对更长信息序列的高效处理能力。

特别值得一提的是,Nemotron-Nano-9B-v2在推理功能控制方面实现了前所未有的灵活性。用户不仅可以默认获取推理过程的详细跟踪记录,还可以通过简单的控制指令如/think或/no_think随时切换这一功能。此外,模型内置了创新的运行时”思考预算”管理系统,允许开发者精确设定推理过程所允许的最大token数量,从而在准确性与响应速度之间实现理想的平衡。

基准测试结果有力证明了Nemotron-Nano-9B-v2的卓越性能。在使用NeMo-Skills套件的”推理开启”模式下,该模型在多项关键测试中均表现突出,其综合表现甚至超越了其他同类小型开源模型,充分彰显了Nvidia在模型优化方面的领先实力。

Nvidia发布Nemotron-Nano-9B-v2高效开放模型 支持推理开关插图2

在开源策略方面,Nvidia以极具吸引力的开放模型许可证发布了Nemotron-Nano-9B-v2,不仅允许商业用途,更赋予开发者完全的自由权去创建和分发衍生模型。尤为重要的是,Nvidia明确表示不会对模型生成的任何输出主张所有权,确保用户能够完全掌控其应用成果。这一举措标志着Nvidia在推动语言模型高效化与可控化发展道路上的坚定步伐。

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

? Nvidia 推出了新型小型语言模型 Nemotron-Nano-9B-v2,支持用户灵活控制推理功能。
⚙️ 该模型基于先进的混合架构,能够高效处理长序列信息,适用于多语言任务。
? Nemotron-Nano-9B-v2以开放模型许可证发布,允许开发者进行商业用途和衍生模型的创建。

最新快讯

2026年03月05日

15:10
微新创想:OpenAI近期被曝正在开发多项针对ChatGPT网页端的深度更新,旨在通过高度定制化的工具生态进一步降低AI生成的“机械感”。据开发者Tibor Blaho泄露的测试界面显示,核心升级聚焦于全新的“写作模板”功能。该功能允许用户上传个人历史邮件、文章或特定文档作为语料样本,由系统自动提取并生成匹配用户特定语气、结构与表达习惯的风格模板。 微新创想...
15:10
微新创想:2026 年 3 月 5 日 全球家电巨头海尔智家正式发布了行业首个“AI+ 细分岗位能力模型” 这一创新举措不仅填补了智能家居行业在数字化人才评价标准上的空白 更标志着企业的人才战略正式从“通用型数字化”转向“垂直化 AI 实战” 海尔智家此次发布的模型采用了领先的“三维建模框架” 通过对内部顶尖人才的深度访谈以及外部专家的严苛校准 构建起一套科...
14:44
声明:本文来自于微信公众号 新榜,作者:云飞扬1993,授权站长之家转载发布。毒鸡汤界终于迎来了年轻人自己的“真专家”。最近,一个名为“老赵讲道理”的公众号迅速蹿红,仅用两个月时间就从0-1涨粉超20万,10万+爆文超9篇。看着账号介绍中的“发表过十余篇SCI论文”,你以为这是学界大佬下凡做公众号?其实这是一位名叫“是草莓味的猫...
14:43
微新创想:2026年3月5日,马士基宣布对亚洲至西非航线网络进行全面升级。此次调整标志着马士基在非洲市场战略部署的重要一步,旨在进一步加强其在全球物流网络中的竞争力。 自2026年第二季度起,马士基将在保留原有FEW3航线的基础上,新增FEW1航线。这一举措不仅扩大了服务范围,也提升了整体运输能力,为客户提供更多样化的选择。 新增的FEW1航线将通过减少挂靠...
14:43
微新创想:2026年3月5日,OpenAI计划升级网页版ChatGPT。此次更新将引入全新的‘创建模板Beta’工具,用户可以上传以往的邮件或文章作为参考,AI将根据这些示例精准模仿其写作风格、语气与结构,从而帮助用户更高效地生成符合需求的内容。 微新创想:编辑区也将迎来多项改进,新增的To/CC/BCC邮件字段使用户在撰写邮件时更加便捷。同时,用户可以享受...
14:43
微新创想:3月5日,TCL在北京举办2026显示器新品发布会,正式推出全球首款1040Hz Mini LED显示器——TCL 27P2A Ultra。这款显示器凭借其突破性的技术配置,成为电竞领域的焦点产品。 该机采用TCL华星HFS Shoot面板与Tmoc超级动态锐利技术,显著提升了显示效果和响应速度。GTG延迟低至1ms,MPRT延迟更是仅需0.1ms...
14:43
微新创想:3月4日,谷歌安卓生态系统总裁Sameer Samat在西班牙巴塞罗那MWC 2026展会期间宣布,公司将于2026年内正式推出全新桌面平台Aluminium OS。这一消息引起了广泛关注,标志着谷歌在操作系统领域迈出了重要一步。 Aluminium OS将深度融合安卓与ChromeOS,为用户提供更加统一和流畅的跨设备体验。通过整合两者的优势,该...
14:43
微新创想:vivo通信科技产品经理韩伯啸在3月5日透露,即将发布的X300 Ultra将配备三大蔡司大师镜头,进一步提升影像表现力。该机全球首发蓝图×索尼LYTIA-901传感器,带来更出色的感光能力和画质细节。主摄采用独家35mm黄金焦段设计,搭配2亿像素与1/1.12英寸超大底,单像素感光面积较前代提升超过30%,为用户带来更清晰、细腻的拍摄体验。 在防...
14:43
微新创想:3月5日,福建矢量引擎科技有限公司在福建正式成立,注册资本为1000万元。该公司由抖音有限公司通过间接方式全资控股,标志着抖音在本地化技术研发方面迈出重要一步。公司注册地设在福建省,其主营业务聚焦于企业技术研发与科技服务领域,具体业务方向目前尚未对外公开。此次成立被视为抖音强化自身底层技术能力的关键动作,意在进一步提升算法优化、内容渲染及三维技术处...
14:43
微新创想:2026年3月4日 美国糖尿病管理服务商MiniMed在纳斯达克交易所正式上市 证券代码为MMED MiniMed是一家总部位于美国的公司 专注于研发与生产胰岛素泵 连续血糖监测系统及配套传感器等核心产品 此次IPO的目的是为了扩大其全球临床服务网络 并加速AI驱动的闭环血糖管理技术研发 上市后 MiniMed将强化与医疗机构及医保体系的合作 以提...
14:43
微新创想:2026年3月5日,北京华电光大环境股份有限公司(简称“华电光大”)收到北交所IPO问询函。该问询函主要围绕公司治理结构和股权关系展开,涉及多个关键问题。 该公司成立于2013年,注册地为北京昌平,专注于新型催化材料的研发与产业化。作为一家国家级专精特新“小巨人”企业,华电光大在行业内具有较高的技术水平和市场竞争力。 问询函重点关注了实际控制人贾文...
14:43
微新创想:3月3日,谷歌在安卓16 QPR3版本中正式全面开放“已连接的显示屏”功能。这一更新为安卓用户带来了全新的使用体验,允许用户通过数据线将安卓手机或平板连接到外部显示器。连接后,设备将呈现出类似PC的桌面界面,包括底部任务栏、多窗口自由缩放以及跨屏操作等功能,极大地增强了移动设备的生产力表现。 微新创想:用户在使用该功能时,可以享受到更宽敞的操作空间...