生成式AI时代已经到来,它的iPhone时刻已然降临!8月8日,英伟达CEO黄仁勋再次亮相世界顶级计算机图形学会议SIGGRAPH,带来了一系列震撼人心的重磅更新——下一代GH200超级芯片平台、AI Workbench、OpenUSD等,将过去数十年的创新成果,如人工智能、虚拟世界、加速、模拟、协作等,完美融合。在这个LLM大爆炸的时代,老黄依然大胆放话:”买得越多,省得越多!”

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图

英伟达最强AI超算再升级

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图1

5年前,英伟达通过将人工智能和实时光线追踪技术引入GPU,重新定义了计算机图形学。老黄当时表示:”当我们通过AI重新定义计算机图形学时,我们也在为AI重新定义GPU。”这一创新引领了日益强大的计算系统,例如集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。如今,老黄再次将AI计算推向新高度——为NVIDIA GH200 Grace Hopper配备更先进的HBM3e内存,同时下一代GH200超级芯片平台将具备连接多个GPU的能力,实现卓越性能和易于扩展的服务器设计。这个全新平台将能处理世界上最复杂的生成式工作负载,包括大语言模型、推荐系统和向量数据库等。例如,双核心方案包含一台配备144个Arm Neoverse核心、282GB HBM3e内存的服务器,提供8 petaflops的AI算力。全新HBM3e内存比当前HBM3快50%,10TB/sec的组合带宽使得新平台可运行比上一版本大3.5倍的模型,同时通过3倍更快的内存带宽提升性能。该产品预计将于2024年第二季度推出。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图2

RTX工作站:绝佳刀法,4款显卡齐上新

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图3

此次老黄还全面更新了桌面AI工作站GPU系列,一口气推出4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。如果H100及配套产品线展示的是英伟达GPU性能的天际线,那么这几款针对桌面和数据中心的产品则是老黄对成本敏感客户的绝佳”刀法”。在发布新GPU时,现场发生了一个意外的小插曲。老黄从后台拿出第一块GPU时,似乎不慎在镜面面板上沾了指纹。老黄发现后有些不好意思地向现场观众道歉,称这次产品发布可能是史上最差的一次。看来即使是开发布会老手如老黄,也会有翻车的时刻。这位可爱的老黄也赢得了现场观众的阵阵笑声。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图4

言归正传,作为旗舰级专业卡,RTX 6000的性能参数无疑是4款新品中最强的。它拥有48GB显存、18176个CUDA核心、568个Tensor核心、142个RT核心,以及高达960GB/s的带宽,堪称一骑绝尘。RTX 5000配备32GB显存、12800个CUDA核心、400个Tensor核心、100个RT核心。RTX 4500配备24GB显存、7680个CUDA核心、240个Tensor核心、60个RT核心。RTX 4000配备20GB显存、6144个CUDA核心、192个Tensor核心、48个RT核心。基于这4款新GPU,老黄还为企业客户推出了一套一站式解决方案——RTX Workstation。该方案支持最多4张RTX 6000 GPU,可在15小时内完成8.6亿token的GPT3-40B微调,还能让Stable Diffusion XL每分钟生成40张图片,比4090快5倍。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图5

OVX服务器:搭载L40S,性能小胜A100

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图6

专为搭建数据中心设计的NVIDIA L40S GPU,性能更是惊人。基于Ada Lovelace架构的L40S配备48GB GDDR6显存和846GB/s带宽,在第四代Tensor核心和FP8 Transformer引擎加持下,可提供超过1.45 petaflops的张量处理能力。对于算力要求较高的任务,L40S的18,176个CUDA核心可提供近5倍于A100的单精度浮点(FP32)性能,加速复杂计算和数据密集型分析。此外,英伟达还为L40S配备了142个第三代RT核心,提供212 teraflops的光线追踪性能。对于具有数十亿参数和多种模态的生成式AI工作负载,L40S相较于A100可实现高达1.2倍的推理性能提升,以及高达1.7倍的训练性能提升。在L40S GPU加持下,老黄又推出了最多可搭载8张L40S的OVX服务器。对于8.6亿token的GPT3-40B模型,OVX服务器只需7小时就能完成微调;对于Stable Diffusion XL模型,则可实现每分钟80张的图像生成。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图7

AI Workbench:加速定制生成式AI应用

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图8

除了强大的硬件,老黄还重磅发布了全新NVIDIA AI Workbench,帮助开发和部署生成式AI模型。AI Workbench为开发者提供了一个统一且易于使用的工具包,能快速在PC或工作站上创建、测试和微调模型,并无缝扩展到几乎任何数据中心、公有云或NVIDIA DGX Cloud上。其优势包括:- 易于使用:通过单一平台管理数据、模型和计算资源,简化开发过程,支持跨机器和环境协作。- 集成AI开发工具和存储库:与GitHub、NVIDIA NGC、Hugging Face等服务集成,支持JupyterLab和VS Code等工具,在不同平台和基础设施上开发。- 增强协作:采用以项目为中心的架构,便于自动化版本控制、容器管理和处理机密信息,支持团队协作。- 访问加速计算资源:采用客户端-服务器模式,团队可在本地计算资源上开发,在训练任务变大时切换到数据中心或云资源。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图9

Stable Diffusion XL自定义图像生成

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图10

首先,打开AI Workbench并克隆一个存储库。接着,在Jupyter Notebook中从Hugging Face加载预训练的Stable Diffusion XL模型,要求它生成一个”太空中的Toy Jensen”。然而,根据输出图像可以看出,模型并不知道Toy Jensen是谁。这时,可以通过DreamBooth,并使用8张Toy Jensen的图片对模型进行微调。最后,在用户界面上重新运行推理。现在,模型知道了Toy Jensen是谁,就能生成切合需求的图像了。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图11

Hugging Face一键访问最强算力

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图12

作为最受AI开发者喜爱的平台之一,Hugging Face拥有200万用户、超25万个模型,以及5万个数据集。这次,英伟达与Hugging Face达成合作,开发者可通过Hugging Face平台直接获得英伟达DGX Cloud AI超算的加持,更高效地完成AI模型的训练和微调。每个DGX Cloud实例都配备8个H100或A100 80GB GPU,每个节点共有640GB显存,满足顶级AI工作负载的性能要求。此外,英伟达还将联合Hugging Face推出全新的”Training Cluster as a Service”服务,简化企业创建和定制生成式AI模型的过程。对此,老黄激动表示:”这次,Hugging Face和英伟达将世界上最大的AI社区与全球领先的云AI计算平台真正地连接在了一起。Hugging Face的用户只需点击一下,即可访问英伟达的最强AI算力。”

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图13

AI Enterprise 4.0:定制企业级生成式AI

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图14

为了进一步加速生成式AI应用,英伟达将企业级平台NVIDIA AI Enterprise升级到4.0版本。目前,AI Enterprise 4.0不仅为企业提供生成式AI所需的工具,还提供生产部署所需的安全性和API稳定性。- NVIDIA NeMo:一个用于构建、定制和部署大语言模型的云原生框架。借助NeMo,英伟达AI Enterprise为创建和定制大语言模型应用提供端到端支持。- NVIDIA Triton管理服务:帮助企业进行自动化和优化生产部署,使其在Kubernetes中自动部署多个推理服务器实例,并通过模型协调实现可扩展的高效运行。- NVIDIA Base Command Manager Essentials:集群管理软件,帮助企业在数据中心、多云和混合云环境中最大化AI服务器的性能和利用率。除了英伟达自己,AI Enterprise 4.0还将集成到其他合作伙伴,如Google Cloud和Microsoft Azure等。此外,MLOps提供商,包括Azure Machine Learning、ClearML、Domino Data Lab、Run:AI和Weights & Biases,也将与英伟达AI平台无缝集成,简化生成式AI模型的开发。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图15

Omniverse:在元宇宙中加入大语言模型

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图16

最后,是NVIDIA Omniverse平台的更新。接入OpenUSD和AIGC工具后,开发者可以更轻松地生成模拟真实世界的3D场景和图形。Omniverse是一个集合了各种工具的3D图形制作协作平台,3D开发者可以像文字编辑在飞书或钉钉中一样,在Omniverse上共同制作3D图形和场景。不同3D制作工具的成果可以直接整合在Omniverse之内,将3D图形和场景的制作工作流彻底打通,化繁为简。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图17

OpenUSD

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图18

这次更新中,接入的OpenUSD是什么?OpenUSD(Universal Scene Description)提供了一个开源、通用的场景描述格式,使不同品牌、不同类型的3D设计软件可以无障碍协作。Omniverse本身就是建立在USD体系之上的,这次Omniverse针对OpenUSD的升级,为开发者和企业推出了更多的框架和资源服务。基于OpenUSD这个开源的3D图像编辑格式,5家公司(苹果、皮克斯、Adobe、Autodesk、英伟达)成立了AOUSD联盟,进一步推动了3D图像业界采用OpenUSD格式。借助AOUSD联盟的成立,Omniverse的开发者也可以方便地创建各种兼容苹果的ARKit或RealityKit的素材和内容。更新后Omniverse也支持OpenXR标准,使得Omniverse能够支持HTC VIVE、Magic Leap、Vajio等VR头显设备。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图19

API,ChatUSD和其他更新

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图20

此外,英伟达还发布了新的Omniverse Cloud API,让开发者可以更无缝地部署OpenUSD管线和应用程序。而最引人瞩目的,就是支持基于大语言模型的ChatUSD。ChatUSD能像Github Copilot一样,在Omniverse平台中回答开发者的相关问题,或自动生成Python-USD的代码,让开发人员效率暴增。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图21

总而言之,英伟达再次用暴力的产品、令人惊叹的技术、高瞻远瞩的洞见,让全世界看到,它未来将如何引领世界AI和图形计算的新浪潮。在老黄的经典名言”the more you buy,the more you save!”中,老黄缓缓走下舞台,却把现场气氛推向了最高潮。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图22

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图23

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图24

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图25

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图26

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图27

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图28

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图29

最新快讯

2025年08月05日

18:38
近日,湖南一位男子上演了惊险又有趣的挑战——背着约40公斤重的蜜雪冰城饮品攀登武功山,并在沿途以每杯15元的价格向游客售卖,这一独特的登山方式被拍摄成视频后迅速引爆网络,引发广泛关注,不少网友更是直呼其为"行走中的奶茶大佬"。据该男子美金介绍,除了沉重的饮品外,他还额外携带了饮用水、便携餐食等个人生活用品,所有物资全靠他一个人肩扛背负,相较于普通登山,负重量...
18:38
谷歌 AI 编程助手 Jules 近期迎来重大功能升级,新增了创建拉取请求(PR)的核心能力,为软件开发流程带来了革命性改进。这一突破性更新实现了从编码到提交的完整闭环,显著提升了开发效率与团队协作体验。根据 Jules 的最新更新日志,用户在完成代码编写后,只需简单指令,即可让 Jules 自动打包变更并生成规范的拉取请求,彻底告别繁琐的手动操作。 这一创...
18:38
麒麟信安于8月5日正式宣布,其自主研发的嵌入式操作系统已成功启动与超能机器人产品的合作研发项目,将应用于备受瞩目的“湘江1号”健康陪护人形机器人。此次合作标志着麒麟信安在智能操作系统领域又一重要突破,为未来人形机器人产业的创新发展奠定了坚实基础。 据悉,麒麟信安与超能机器人团队正紧密协作,共同推进嵌入式操作系统的适配工作。该系统凭借其高效稳定的运行特性,有望...
18:38
2025年8月5日,北京时间,现货黄金市场经历了一波显著的短线下跌,价格一度跌破3360美元/盎司的关键支撑位,当日整体跌幅达到0.41%。这一波动主要源于市场情绪的剧烈变化以及短期资金流动的异常调整,反映出投资者对于黄金短期走势的判断存在明显分歧。当前,整个市场正高度聚焦于晚间即将发布的美国非农就业数据,这一关键经济指标或将对金价未来的走向产生决定性影响,...
18:38
芯朋微近日发布重要公告,宣布公司高管张立新拟通过集中竞价交易方式减持部分公司股份。根据公告内容,此次减持计划涉及的股份比例将严格控制在公司总股本2%以内,确保减持行为在合理范围内进行。 此次减持主要源于张立新个人资金需求的合理调配,减持价格将完全遵循市场供求关系自主确定,体现了公司对市场规则的尊重和执行。值得注意的是,张立新目前仍持有公司一定比例的股份,此次...
18:38
2025年8月5日,中国水产领域的领军企业国联水产与知名基金海洋壹号基金正式达成战略合作协议。根据协议内容,海洋壹号基金将斥资近1亿元人民币,专项支持国联水产在核心竞争力的提升、技术革新与产品研发方面的战略布局。此次资本注入不仅将加速国联水产的产业升级进程,更将为其在高端水产品市场的发展注入强劲动力。 此次战略合作的核心目标在于巩固国联水产在水产品精深加工领...
18:38
宇树科技于8月5日震撼发布全新四足机器人——Unitree A2,这款高性能机器狗重量约37千克,在空载状态下可实现20公里的续航里程。根据官方发布的演示视频,Unitree A2展现出惊人的运动能力,其最大奔跑速度可达到5米每秒,轻松跨越1米高的障碍物,更令人惊叹的是它能够承受成人背部蹦跳的冲击,同时也能在碎石等复杂地形中稳定前行。 Unitree A...
18:38
8月5日,腾讯混元重磅推出AI播客功能,为内容创作领域带来革命性突破。该功能能够将文本、网页、文档等多样化内容一键转化为自然流畅的双人对谈式音频,让静态信息“活”起来,为用户带来全新的听觉体验。 据悉,AI播客的核心优势在于其惊人的转换效率。腾讯混元表示,该功能平均仅需90秒即可完成内容转化,极大地缩短了制作周期。同时,用户还可以实时查看转换进度,随时掌...
18:38
2025年8月5日14时,自然资源部紧急宣布将广东省地质灾害防御响应级别提升至Ⅲ级。这一决策基于气象部门的最新预报以及综合风险评估结果,针对未来三天内广东中北部地区可能出现的较高地质灾害风险。据监测显示,该区域强降雨天气频发,山体滑坡、泥石流等次生灾害隐患显著增加,亟需采取严密防控措施。 为强化应急响应能力,自然资源部已迅速组建专项工作组,即刻启程前往广东省...
18:38
2025年8月5日,*ST节能正式对外宣布一则振奋人心的消息其子公司联合立本牵头组建的联合体成功中标洛阳平洛新能源有限公司孟津区独立储能项目EPC总承包工程这一重要成果不仅彰显了公司在新能源领域的综合实力更标志着其在储能业务版图上迈出了坚实一步项目勘察设计费报价高达320万元建设工程费更是达到3.01亿元如此规模的项目落地将为公司带来可观的业务增量预计将显著...
18:38
2025年8月5日,中国农业银行在债券市场传来重大突破,成功发行总额高达500亿元人民币的总损失吸收能力非资本债券,标志着该行在金融风险管理领域迈出创新性步伐。此次发行涵盖4年期、6年期和11年期三个期限品种,票面利率分别设定为1.85%、1.93%和2.15%,均具备条件性赎回条款,为投资者提供了灵活的配置选择。值得注意的是,这类非资本债券的核心功能在于增...