生成式AI时代已经到来,它的iPhone时刻已然降临!8月8日,英伟达CEO黄仁勋再次亮相世界顶级计算机图形学会议SIGGRAPH,带来了一系列震撼人心的重磅更新——下一代GH200超级芯片平台、AI Workbench、OpenUSD等,将过去数十年的创新成果,如人工智能、虚拟世界、加速、模拟、协作等,完美融合。在这个LLM大爆炸的时代,老黄依然大胆放话:”买得越多,省得越多!”

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图

英伟达最强AI超算再升级

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图1

5年前,英伟达通过将人工智能和实时光线追踪技术引入GPU,重新定义了计算机图形学。老黄当时表示:”当我们通过AI重新定义计算机图形学时,我们也在为AI重新定义GPU。”这一创新引领了日益强大的计算系统,例如集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。如今,老黄再次将AI计算推向新高度——为NVIDIA GH200 Grace Hopper配备更先进的HBM3e内存,同时下一代GH200超级芯片平台将具备连接多个GPU的能力,实现卓越性能和易于扩展的服务器设计。这个全新平台将能处理世界上最复杂的生成式工作负载,包括大语言模型、推荐系统和向量数据库等。例如,双核心方案包含一台配备144个Arm Neoverse核心、282GB HBM3e内存的服务器,提供8 petaflops的AI算力。全新HBM3e内存比当前HBM3快50%,10TB/sec的组合带宽使得新平台可运行比上一版本大3.5倍的模型,同时通过3倍更快的内存带宽提升性能。该产品预计将于2024年第二季度推出。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图2

RTX工作站:绝佳刀法,4款显卡齐上新

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图3

此次老黄还全面更新了桌面AI工作站GPU系列,一口气推出4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。如果H100及配套产品线展示的是英伟达GPU性能的天际线,那么这几款针对桌面和数据中心的产品则是老黄对成本敏感客户的绝佳”刀法”。在发布新GPU时,现场发生了一个意外的小插曲。老黄从后台拿出第一块GPU时,似乎不慎在镜面面板上沾了指纹。老黄发现后有些不好意思地向现场观众道歉,称这次产品发布可能是史上最差的一次。看来即使是开发布会老手如老黄,也会有翻车的时刻。这位可爱的老黄也赢得了现场观众的阵阵笑声。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图4

言归正传,作为旗舰级专业卡,RTX 6000的性能参数无疑是4款新品中最强的。它拥有48GB显存、18176个CUDA核心、568个Tensor核心、142个RT核心,以及高达960GB/s的带宽,堪称一骑绝尘。RTX 5000配备32GB显存、12800个CUDA核心、400个Tensor核心、100个RT核心。RTX 4500配备24GB显存、7680个CUDA核心、240个Tensor核心、60个RT核心。RTX 4000配备20GB显存、6144个CUDA核心、192个Tensor核心、48个RT核心。基于这4款新GPU,老黄还为企业客户推出了一套一站式解决方案——RTX Workstation。该方案支持最多4张RTX 6000 GPU,可在15小时内完成8.6亿token的GPT3-40B微调,还能让Stable Diffusion XL每分钟生成40张图片,比4090快5倍。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图5

OVX服务器:搭载L40S,性能小胜A100

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图6

专为搭建数据中心设计的NVIDIA L40S GPU,性能更是惊人。基于Ada Lovelace架构的L40S配备48GB GDDR6显存和846GB/s带宽,在第四代Tensor核心和FP8 Transformer引擎加持下,可提供超过1.45 petaflops的张量处理能力。对于算力要求较高的任务,L40S的18,176个CUDA核心可提供近5倍于A100的单精度浮点(FP32)性能,加速复杂计算和数据密集型分析。此外,英伟达还为L40S配备了142个第三代RT核心,提供212 teraflops的光线追踪性能。对于具有数十亿参数和多种模态的生成式AI工作负载,L40S相较于A100可实现高达1.2倍的推理性能提升,以及高达1.7倍的训练性能提升。在L40S GPU加持下,老黄又推出了最多可搭载8张L40S的OVX服务器。对于8.6亿token的GPT3-40B模型,OVX服务器只需7小时就能完成微调;对于Stable Diffusion XL模型,则可实现每分钟80张的图像生成。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图7

AI Workbench:加速定制生成式AI应用

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图8

除了强大的硬件,老黄还重磅发布了全新NVIDIA AI Workbench,帮助开发和部署生成式AI模型。AI Workbench为开发者提供了一个统一且易于使用的工具包,能快速在PC或工作站上创建、测试和微调模型,并无缝扩展到几乎任何数据中心、公有云或NVIDIA DGX Cloud上。其优势包括:- 易于使用:通过单一平台管理数据、模型和计算资源,简化开发过程,支持跨机器和环境协作。- 集成AI开发工具和存储库:与GitHub、NVIDIA NGC、Hugging Face等服务集成,支持JupyterLab和VS Code等工具,在不同平台和基础设施上开发。- 增强协作:采用以项目为中心的架构,便于自动化版本控制、容器管理和处理机密信息,支持团队协作。- 访问加速计算资源:采用客户端-服务器模式,团队可在本地计算资源上开发,在训练任务变大时切换到数据中心或云资源。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图9

Stable Diffusion XL自定义图像生成

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图10

首先,打开AI Workbench并克隆一个存储库。接着,在Jupyter Notebook中从Hugging Face加载预训练的Stable Diffusion XL模型,要求它生成一个”太空中的Toy Jensen”。然而,根据输出图像可以看出,模型并不知道Toy Jensen是谁。这时,可以通过DreamBooth,并使用8张Toy Jensen的图片对模型进行微调。最后,在用户界面上重新运行推理。现在,模型知道了Toy Jensen是谁,就能生成切合需求的图像了。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图11

Hugging Face一键访问最强算力

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图12

作为最受AI开发者喜爱的平台之一,Hugging Face拥有200万用户、超25万个模型,以及5万个数据集。这次,英伟达与Hugging Face达成合作,开发者可通过Hugging Face平台直接获得英伟达DGX Cloud AI超算的加持,更高效地完成AI模型的训练和微调。每个DGX Cloud实例都配备8个H100或A100 80GB GPU,每个节点共有640GB显存,满足顶级AI工作负载的性能要求。此外,英伟达还将联合Hugging Face推出全新的”Training Cluster as a Service”服务,简化企业创建和定制生成式AI模型的过程。对此,老黄激动表示:”这次,Hugging Face和英伟达将世界上最大的AI社区与全球领先的云AI计算平台真正地连接在了一起。Hugging Face的用户只需点击一下,即可访问英伟达的最强AI算力。”

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图13

AI Enterprise 4.0:定制企业级生成式AI

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图14

为了进一步加速生成式AI应用,英伟达将企业级平台NVIDIA AI Enterprise升级到4.0版本。目前,AI Enterprise 4.0不仅为企业提供生成式AI所需的工具,还提供生产部署所需的安全性和API稳定性。- NVIDIA NeMo:一个用于构建、定制和部署大语言模型的云原生框架。借助NeMo,英伟达AI Enterprise为创建和定制大语言模型应用提供端到端支持。- NVIDIA Triton管理服务:帮助企业进行自动化和优化生产部署,使其在Kubernetes中自动部署多个推理服务器实例,并通过模型协调实现可扩展的高效运行。- NVIDIA Base Command Manager Essentials:集群管理软件,帮助企业在数据中心、多云和混合云环境中最大化AI服务器的性能和利用率。除了英伟达自己,AI Enterprise 4.0还将集成到其他合作伙伴,如Google Cloud和Microsoft Azure等。此外,MLOps提供商,包括Azure Machine Learning、ClearML、Domino Data Lab、Run:AI和Weights & Biases,也将与英伟达AI平台无缝集成,简化生成式AI模型的开发。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图15

Omniverse:在元宇宙中加入大语言模型

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图16

最后,是NVIDIA Omniverse平台的更新。接入OpenUSD和AIGC工具后,开发者可以更轻松地生成模拟真实世界的3D场景和图形。Omniverse是一个集合了各种工具的3D图形制作协作平台,3D开发者可以像文字编辑在飞书或钉钉中一样,在Omniverse上共同制作3D图形和场景。不同3D制作工具的成果可以直接整合在Omniverse之内,将3D图形和场景的制作工作流彻底打通,化繁为简。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图17

OpenUSD

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图18

这次更新中,接入的OpenUSD是什么?OpenUSD(Universal Scene Description)提供了一个开源、通用的场景描述格式,使不同品牌、不同类型的3D设计软件可以无障碍协作。Omniverse本身就是建立在USD体系之上的,这次Omniverse针对OpenUSD的升级,为开发者和企业推出了更多的框架和资源服务。基于OpenUSD这个开源的3D图像编辑格式,5家公司(苹果、皮克斯、Adobe、Autodesk、英伟达)成立了AOUSD联盟,进一步推动了3D图像业界采用OpenUSD格式。借助AOUSD联盟的成立,Omniverse的开发者也可以方便地创建各种兼容苹果的ARKit或RealityKit的素材和内容。更新后Omniverse也支持OpenXR标准,使得Omniverse能够支持HTC VIVE、Magic Leap、Vajio等VR头显设备。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图19

API,ChatUSD和其他更新

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图20

此外,英伟达还发布了新的Omniverse Cloud API,让开发者可以更无缝地部署OpenUSD管线和应用程序。而最引人瞩目的,就是支持基于大语言模型的ChatUSD。ChatUSD能像Github Copilot一样,在Omniverse平台中回答开发者的相关问题,或自动生成Python-USD的代码,让开发人员效率暴增。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图21

总而言之,英伟达再次用暴力的产品、令人惊叹的技术、高瞻远瞩的洞见,让全世界看到,它未来将如何引领世界AI和图形计算的新浪潮。在老黄的经典名言”the more you buy,the more you save!”中,老黄缓缓走下舞台,却把现场气氛推向了最高潮。

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图22

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图23

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图24

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图25

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图26

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图27

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图28

英伟达黄仁勋深夜炸场 AIGCiPhone时刻降临Hugging Face接入最强超算插图29

最新快讯

2026年02月10日

22:08
微新创想:2025年春运期间,全国铁路运输迎来高峰。自2月2日春运正式启动至2月10日,全国铁路累计发送旅客已突破1亿人次。随着春节临近,返乡客流持续攀升,铁路部门不断加大运力投入以满足出行需求。 2月10日作为北方小年,预计全国铁路将发送旅客1395万人次。为应对客流高峰,铁路部门当天加开列车1363列,全力保障旅客出行。相比前一日,2月9日的发送量为14...
22:08
微新创想:2026年2月10日,苹果公司针对英国竞争与市场管理局(CMA)的反垄断调查,正式宣布了四项承诺。这些承诺旨在回应监管机构对其在应用分发和系统内自我优待行为的质疑,涵盖多个关键领域。首先,苹果承诺确保App Store的审核与排名机制更加公平透明,杜绝任何形式的偏袒。其次,公司将严格保护第三方开发者的数据安全,防止未经授权的数据访问或滥用。此外,苹...
22:08
微新创想:2026年2月10日,挪威国家石油公司宣布,计划在2030年前将国际石油产量提升至90万桶油当量/日。这一战略举措旨在优化全球资产组合,进一步强化公司在海外市场的业务布局。公司表示,此次增产计划将有助于提升其在全球能源市场中的竞争力。 微新创想:尽管公司未公布具体的投资金额以及重点增产区域,但明确指出该计划将兼顾低碳转型的目标。这意味着在扩大石油产...
22:08
微新创想:2026年2月10日,伦敦证券交易所集团(LSEG)宣布与法国安盛投资管理公司(AXA Investment Managers)建立私募基金基础设施合作伙伴关系 双方将在欧洲及全球范围内合作开发标准化、数字化的私募基金数据报告与合规服务平台 该平台旨在提升私募基金在估值、披露和监管报送方面的效率与透明度 合作不涉及股权交易 将依托LSEG的Data...
22:08
微新创想:2026年2月10日,裕同科技(002831.SZ)发布公告,宣布拟以4.49亿元人民币收购华研科技51%的股份。此次交易的对手为观点投资,该公司由裕同科技实际控制人王华君与吴兰兰夫妇全资控股,因此该交易被认定为关联交易。资金来源为公司自有资金或自筹资金,交易完成后,华研科技将成为裕同科技的控股子公司,并纳入公司的合并报表范围。 华研科技自2016...
22:08
2026年2月10日,国家医保局发布2026年度第一批“高效办成一件事”重点事项清单。明确要求2026年底前,全国所有省份开通职工医保个人账户跨省共济功能。同时,目标包括:80%定点医疗机构实现医保费用即时结算;至少开展一批次国家组织药品和高值医用耗材集采;基本实现住院分娩生育医疗费用省内跨统筹区直接结算。此举旨在提升医保服务便捷性与公平性,强化个人账户资...
22:08
微新创想:2026年2月10日,蒙古国进口炼焦煤市场震荡偏弱。受春节假期临近影响,下游焦钢企业补库基本结束,采购情绪低迷,询盘问价偏低,现货市场成交氛围冷清。 口岸贸易商报价暂稳,但期货盘面下跌。市场整体表现较为疲软,缺乏明显的上涨动力。部分企业因节前备货需求已基本完成,导致短期内对炼焦煤的需求有所下降。 值得注意的是,蒙古国线上电子竞拍参与积极性提升,当日...
21:52
微新创想 2月10日,小米集团创始人、董事长兼CEO雷军在小年夜晚间开启直播。直播中,雷军详细介绍了小米汽车的核心技术之一——一体压铸工艺。他指出,一体压铸技术能够将传统需要七十多个零部件组装的结构,一次性压铸成型,大幅缩短了加工时间。同时,这种技术还显著提升了车身的强度,从而增强了整车的安全性能。不过,雷军也坦言,一体压铸的成本相对较高,这是目前需要克服的...
21:52
微新创想 2月10日的消息显示,小米集团创始人、董事长兼CEO雷军在小年夜当天开启了直播。在直播过程中,雷军分享了小米汽车工厂的最新进展,并透露了工厂去年接待游客和访客的数量已超过13万人次。这一数据不仅体现了工厂的吸引力,也反映了小米在智能制造业的影响力。 雷军还提到,小米汽车工厂在智能化方面取得了显著成就。工厂内部配备了六七百台机器人,实现了所有生产环节...
21:52
微新创想:今晚,小米创始人雷军开启小年夜直播。雷军在直播中表示,第一代小米SU7和小米YU7都是基于摩德纳平台来开发的,这个平台有很多优点。它是完全为纯电车做的平台,能把车的外观和比例做得更好看,车身姿态也能非常低趴。 雷军在直播中透露,大家对小米SU7最重要的一个评价是好看好开。而小米SU7的动力之所以很强,是电机够强。在电机方面,小米除了和联电、汇川两家...
21:52
微新创想:近日,在世界大师公开赛上,91岁的传奇跑者策伦成为全场焦点。他以18秒61的成绩斩获80岁组的第二名,这一成绩甚至超越了90岁组的冠军。策伦来自中国内蒙古,他再次用实际行动证明,自己依然是地表最快的90岁跑者。 策伦的运动生涯堪称传奇。据他本人透露,他一生共获得过74枚金牌,三次夺得亚洲百米冠军,并且保持着14项亚洲纪录。这些成就不仅展现了他卓越的...
21:52
微新创想 随着春节临近备受期待的新一代小米SU7已陆续进驻全国多地小米之家门店其中主打配色卡布里蓝成为最大亮点独特的色彩质感一眼就能认出卡布里蓝车身的灵感源自意大利海岛的海蚀蓝洞并非单一色块而是呈现出有呼吸”的动态美感在不同光线条件下它会展现出丰富变化 上个月雷军曾表示原计划三四月份进驻小米之家的新一代小米SU7将加速推进到店节奏春节前部分门店就能迎来实...