Nvidia发布Nemotron-Nano-9B-v2小型模型 支持切换推理功能

Nvidia 近期正式推出了新一代小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型技术正迎来新一轮发展热潮。这款模型拥有9亿个参数,虽然相较于百万级参数的微型模型规模更大,但较其原始的12亿参数版本已大幅精简,核心目标是在Nvidia A10 GPU上实现高效运行。Nvidia AI模型后训练总监Oleksii Kuchiaev在社交平台上强调,参数缩减是为了更好地满足实际部署需求,同时该模型创新性地采用了混合架构,在处理大批量数据时性能提升显著,比同等规模的变换模型速度快达6倍。

Nvidia发布Nemotron-Nano-9B-v2小型模型 支持切换推理功能插图1

Nemotron-Nano-9B-v2具备多语言支持能力,涵盖英语、德语、西班牙语、法语、意大利语、日语等多种语言,特别适用于指令跟随和代码生成等应用场景。其设计中最具创新性的是引入了用户可控的推理机制——用户可以通过简单的控制令牌来切换AI的”思考”过程,即在生成答案前是否进行自我检查。系统默认会保留推理痕迹,但用户可通过如/think或/no_think等命令灵活控制此过程。此外,模型还建立了”思考预算”管理机制,允许开发者精确设定推理过程中使用的标记数量,从而在准确性与响应速度之间实现最佳平衡。

多项基准测试结果印证了Nemotron-Nano-9B-v2的卓越性能。在”推理开启”模式下,该模型在AIME25、MATH500、GPQA和LiveCodeBench等权威测试中均表现出色。同时,在指令跟随和长上下文基准测试中同样展现出超越其他开放小型模型的准确度。Nvidia特别为这款模型提供了开放许可协议,允许开发者在商业环境中自由使用和分发,并明确声明不对模型生成的任何内容主张所有权。这一举措彻底打破了传统模型使用的门槛和费用顾虑,使企业能够立即将模型投入生产应用。

Nvidia发布Nemotron-Nano-9B-v2小型模型 支持切换推理功能插图2

Nvidia Nemotron-Nano-9B-v2模型为需要在小规模设备上实现高效推理能力的开发者提供了理想解决方案。其创新的运行预算控制和推理切换功能,为系统构建者提供了前所未有的灵活性,能够根据实际需求动态调整准确性与响应速度的平衡点,必将进一步推动小型语言模型技术的普及与发展。划重点:🌟 Nemotron-Nano-9B-v2是Nvidia全新推出的9亿参数小型语言模型,专为高效部署场景设计。🧠 模型支持多语言并具备可切换的推理功能,让用户能够根据具体需求调整AI响应方式。📈 开放许可协议确保开发者可无限制使用和分发模型,彻底消除商业应用中的费用和许可障碍。

最新快讯

2025年09月04日

10:09
微新创想9月4日讯 华为即将于今日召开备受瞩目的新品发布会,备受期待的第三代折叠屏旗舰Mate XTs非凡大师终于即将揭开神秘面纱。从目前流传的行业信息来看,这款旗舰机型将搭载华为自研的麒麟9020s芯片,这颗全新处理器采用了创新的三丛集架构设计,具体包含1颗主频高达2.5GHz的泰山大核、4颗主频达32.15GHz的泰山中核以及4颗主频为41.6GHz的小...
10:09
微新创想9月3日重磅消息 在最新一期备受瞩目的有问必答栏目中,蔚来汽车就用户普遍关心的"为何尚未推出代客泊车及无人泊车服务"这一话题给出了详尽解答。作为行业先驱,蔚来始终走在智能泊车技术的最前沿。公司明确表示,蔚来是业内首批全面部署包括离车泊入、遥控泊车、超感泊车等创新人车分离泊车形态的汽车制造商。 在刚刚升级的蔚来世界模型智能泊车辅助系统中,长距离漫游...
10:09
德国创新企业 DeepL 宣布进军企业通用人工智能领域,将业务范围从专业翻译拓展至智能体解决方案。新推出的 DeepL 智能体能够跨部门协同工作,自动完成人力资源、市场营销等领域的重复性任务,并支持自然语言指令操作。该产品融合了 DeepL 自主研发的大型语言模型与外部先进技术,实现了更精准的任务执行与数据处理。 DeepL 首席执行官雅罗斯瓦夫・“亚雷克”...
10:09
苹果公司最新旗舰系列iPhone17预计将于9月10日正式发布,此次将推出包括iPhone17Air、iPhone17、iPhone17Pro以及iPhone17Pro Max在内的四款全新机型。值得注意的是,iPhone17Air因采用超薄机身设计,将首次取消物理SIM卡槽,全面转向eSIM技术。这一重大变化不仅意味着国行版iPhone17Air对eSIM...
10:09
OpenAI的估值在近日迎来惊人飞跃,凌晨时分正式突破5000亿美元大关,同时成功完成103亿美元的二级股票出售。这一壮观的资本运作吸引了包括软银、Dragoneer投资集团、Thrive资本在内的多家顶级投资机构的目光,充分展现了OpenAI在资本市场上的耀眼实力。据内部消息透露,OpenAI最初计划允许符合条件的现任及前任员工出售约60亿美元股票,但最终...
10:09
微新创想9月3日深度报道,近日江西景德镇市浮梁县一烧烤店内惊现国家一级保护动物穿山甲,这一罕见事件迅速引发社会广泛关注。据了解,这只珍贵的穿山甲于当晚23时许被意外发现,最初竟被店主妻子误认为普通老鼠。幸运的是,店内食客及时发现并辨认出这是国家一级保护动物穿山甲,立即报警处理。当地派出所民警迅速到场,依法将穿山甲带走暂扣。值得一提的是,店主将这一特殊事件拍摄...
10:09
OpenAI正式宣布ChatGPT Projects功能向全体免费用户开放,这一重要举措标志着该AI平台在功能普及与用户体验优化方面迈出了关键性步伐。此前该功能仅限于付费订阅用户,如今所有用户均可享受这一强大工具,从而更高效地组织和管理AI对话内容。 Projects功能:从专属特权到全民共享 ChatGPT的Projects功能本质上是一个智能化的"工作空...
10:09
科技媒体borncity于9月4日独家报道,微软最新推出的Windows AutoPilot服务近期遭遇了严重的部署异常,导致大量Windows 10和Windows 11用户在开箱体验(OOBE)环节遭遇卡顿。这一技术故障不仅影响了用户体验,也给企业IT管理员带来了新的挑战。 问题具体表现为,当用户在OOBE阶段同意最新的《使用条款》(TOU)时,系统会突...
10:08
近日,国内领先的第三方检验检测服务机构方正检测正式登陆全国股转系统,成功实现挂牌公开转让。证券简称正式定为"方正检测",证券代码为"874858",并采用集合竞价交易方式,正式纳入基础层板块。作为业内综合性检测服务企业,方正检测业务范围广泛,涵盖科研服务、工程质量检测与鉴定、环境监测以及雷电防护系统检测等多个核心领域。 该公司凭借强大的技术实力和完善的服务体...
10:08
9月3日,上海脑韵科技有限公司正式宣布成功斩获千万级天使轮融资,投资方阵容强大,涵盖云米科技、伴飞脑科学孵化器以及某知名上市公司家族办公室。这一重要里程碑不仅为脑韵科技注入了强劲发展动力,更彰显了资本市场对其创新技术的的高度认可。 作为一家致力于前沿科技研发的初创企业,脑韵科技正全力推进"入耳式脑机接口"技术的研发进程,旨在打造全球领先的脑健康可穿戴AI设备...
10:08
2025年9月4日,亚马逊正式发布革命性AI视觉购物功能Lens Live,为全球消费者带来前所未有的实时视觉搜索体验。作为Amazon Lens的全新升级版,该功能通过智能手机摄像头实现实时实物识别,并即时展示匹配的商品信息。这一创新技术不仅大幅提升了购物效率,更将虚拟购物体验推向全新高度。 与Google Lens等同类产品相似,Lens Live的核心...
10:08
9月4日,圆通国际快递正式宣布完成一项战略性土地收购交易,以613.15万美元的价格成功购入哈萨克斯坦阿拉木图州Baiserke村的一块土地,总面积达44.2万平方米。这块具有战略价值的土地位于霍尔果斯-阿拉木图公路南侧,地理位置优越,将为圆通在中亚地区的物流网络布局提供重要支撑。 此次收购是圆通国际快递拓展中亚物流市场的重要举措。根据规划,公司将充分利用这...