Nvidia Rubin CPX GPU重磅发布助力海量上下文AI应用突破

2025-09-10 12:02:47 AI动态 36 次阅读

Nvidia 近期正式揭晓了其尖端研发成果——全新的 Vera Rubin 微架构，并宣布该架构将于2026年正式问世。作为该架构的核心组成部分，Rubin CPX 变体将专门针对需要处理海量上下文窗口的人工智能工作负载进行优化。Nvidia 首席执行官黄仁勋在新闻发布会上强调：”Vera Rubin 平台将引领人工智能计算进入全新纪元，不仅推出下一代 Rubin GPU，还将引入名为 CPX 的新型处理器类别。”Rubin CPX 处理器特别适用于需要处理超过一百万个 token 的复杂应用场景，例如高级软件开发和高分辨率视频生成等前沿领域。

根据 Nvidia 的战略规划，Vera Rubin NDL144CPX 类 GPU 预计将于2026年底正式面向市场。CPX 模型专为需要长上下文窗口的应用场景而设计，能够提供高达8exaflops 的强大人工智能性能，同时具备30PF NVFP4 的上下文计算能力，以及相较于 Nvidia GB300NVL72 系统提升三倍的指数运算性能。此外，该模型还配备了128GB GDDR7 高速内存、4个专业编码器和4个解码器，专为高质量视频生成而优化，并提供惊人的100TB 快速内存容量。

Nvidia 高层表示，Vera Rubin NDL144CPX 可被视为构建大型人工智能工厂的关键组件。为了支持大规模数据中心的构建需求，Nvidia 还计划推出千兆规模的参考设计方案。这意味着 Nvidia 将与领先的基础设施公司展开深度合作，从计算架构层面重新设计数据中心，提供覆盖建筑、设计、模拟、运营等全方位的参考设计方案。这一举措将显著提升数据中心在人工智能时代的处理能力。

在此次重要发布之前，Nvidia 还公布了最新的 MLPerf 推理测试结果，其黑威尔 GPU 在该基准测试中创下历史新纪录，成功超越了Llama3.1405B 交互模型的基线表现。这项突破性技术被称为”解耦服务”，能够使相同硬件在性能上获得显著提升，为已部署解决方案的企业带来了额外的收入增长机会。这一创新不仅展示了 Nvidia 在人工智能领域的领先地位，也为整个行业树立了新的技术标杆。

2026年03月05日

17:23

Nvidia Rubin CPX GPU重磅发布助力海量上下文AI应用突破

最新快讯

2026年03月05日

AI引擎如何评价你的品牌？GEO品牌监测工具推荐及GEOBase实测分享

破亿直播间频出，小红书电商迎来“开门红”

9岁女孩泰国学仰泳3天晒成酱油色回国被海关质疑国籍

Aonic完成1000万美元A轮融资专注农业工业无人机创新应用

海盗船FRAME 5000D工作站机箱发布静音扩展双优化

Momenta秘密提交港股IPO申请拟融资10亿美元把握科技上市热潮

徕卡SL3-P 5月上市 6000欧元定价背照式全画幅相机

HireBound完成200万美元种子轮融资聚焦AI招聘自动化技术

宝马全新i3 NA0 3月18日全球首发新世代首款纯电轿车亮相

亚马逊机器人部门裁员聚焦战略转型 2026年资本支出达2000亿美元

浙江邮政携手华数集团共筑数字浙江新蓝图

阳狮集团任命Naomi Michael为亚太区首席传播官强化品牌影响力

Nvidia Rubin CPX GPU重磅发布 助力海量上下文AI应用突破

最新快讯

2026年03月05日

Nvidia Rubin CPX GPU重磅发布助力海量上下文AI应用突破