Nvidia 近期正式揭晓了其尖端研发成果——全新的 Vera Rubin 微架构,并宣布该架构将于2026年正式问世。作为该架构的核心组成部分,Rubin CPX 变体将专门针对需要处理海量上下文窗口的人工智能工作负载进行优化。Nvidia 首席执行官黄仁勋在新闻发布会上强调:”Vera Rubin 平台将引领人工智能计算进入全新纪元,不仅推出下一代 Rubin GPU,还将引入名为 CPX 的新型处理器类别。”Rubin CPX 处理器特别适用于需要处理超过一百万个 token 的复杂应用场景,例如高级软件开发和高分辨率视频生成等前沿领域。
根据 Nvidia 的战略规划,Vera Rubin NDL144CPX 类 GPU 预计将于2026年底正式面向市场。CPX 模型专为需要长上下文窗口的应用场景而设计,能够提供高达8exaflops 的强大人工智能性能,同时具备30PF NVFP4 的上下文计算能力,以及相较于 Nvidia GB300NVL72 系统提升三倍的指数运算性能。此外,该模型还配备了128GB GDDR7 高速内存、4个专业编码器和4个解码器,专为高质量视频生成而优化,并提供惊人的100TB 快速内存容量。
Nvidia 高层表示,Vera Rubin NDL144CPX 可被视为构建大型人工智能工厂的关键组件。为了支持大规模数据中心的构建需求,Nvidia 还计划推出千兆规模的参考设计方案。这意味着 Nvidia 将与领先的基础设施公司展开深度合作,从计算架构层面重新设计数据中心,提供覆盖建筑、设计、模拟、运营等全方位的参考设计方案。这一举措将显著提升数据中心在人工智能时代的处理能力。
在此次重要发布之前,Nvidia 还公布了最新的 MLPerf 推理测试结果,其黑威尔 GPU 在该基准测试中创下历史新纪录,成功超越了Llama3.1405B 交互模型的基线表现。这项突破性技术被称为”解耦服务”,能够使相同硬件在性能上获得显著提升,为已部署解决方案的企业带来了额外的收入增长机会。这一创新不仅展示了 Nvidia 在人工智能领域的领先地位,也为整个行业树立了新的技术标杆。