OpenAI联合创始人兼兼职科学家Andrej Karpathy近日在公开文章中深入剖析了英伟达GPU短缺问题,引发科技界广泛关注。一张广为流传的图表揭示了各科技巨头在GPU配置上的惊人规模:GPT-4训练可能动用了10000至25000张A100 GPU,Meta拥有约21000张A100,Tesla部署了约7000张,Stability AI则使用了5000张。此外,Falcon-40B模型在384张A100上完成训练,Inflection AI则采用3500张H100和H100混合配置来打造与GPT-3.5同等性能的模型。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图

根据马斯克最新表态,GPT-5研发可能需要30000至50000张H100 GPU。尽管摩根士丹利曾预测GPT-5将使用25000张GPU并已开始训练,但Sam Altman随后澄清称GPT-5尚未启动训练。然而Altman此前曾直言GPU资源极度紧缺,表示”用户用得越少越好”,因为OpenAI根本没有足够的GPU可用。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图1

在《Nvidia H100 GPU:供需》深度分析文章中,Karpathy揭示了科技公司GPU使用现状:目前全球AI领域对H100的需求已累计约43万张。生成式AI浪潮持续高涨,对算力提出更高要求,众多初创企业纷纷采用英伟达最新推出的H100 GPU进行模型训练。马斯克甚至将GPU比作”比药物更难获得的资源”,而Altman也透露OpenAI因GPU限制推迟了多项短期计划。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图2

大型科技公司年度报告中频繁出现GPU相关议题。微软在最新财报中强调GPU是其云业务增长的”关键原材料”,并警告称基础设施短缺可能导致数据中心运营中断。据行业估算,全球企业对H100的需求总量约432000张,按每张35k美元计算,总需求规模高达150亿美元。此外,国内互联网公司对H800等高端GPU需求旺盛,而Jane Street、JP Morgan等金融巨头也纷纷部署数百至数千张A/H100 GPU。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图3

H100之所以成为首选,主要得益于其更优的技术性能:相比A100,H100在16位推理速度提升3.5倍,16位训练速度提升2.3倍,同时缓存延迟更低并支持FP8计算。尽管H100成本仅是A100的1.5-2倍,但综合系统成本优势显著。不过部分企业因成本、容量限制及现有软件兼容性等因素,仍在权衡是否升级至H100。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图4

供应链问题而非产能不足才是GPU短缺主因。英伟达高管明确指出,GPU产能主要受限于供应链,尽管英伟达全力生产,但芯片制造所需其他组件产能不足。台积电作为H100独家代工厂,其5nm产能主要分配给苹果、高通、AMD等客户,导致H100生产受限。爆料称台积电4个5nm生产节点中,H100仅使用N5或N5P的4N节点,且需与英伟达、苹果等共享产能。此外,CoWoS 3D堆叠封装技术瓶颈,以及SK Hynix等HBM内存供应商产能不足,进一步加剧了H100短缺。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图5

英伟达首席财务官Colette Kress在财报电话会议中透露,下半年GPU供应将大幅提升,但未提供具体数据。一位私有云负责人指出,GPU短缺已形成恶性循环:稀缺性导致企业囤积GPU,反而加剧了市场供需矛盾。根据英伟达路线图,H100下一代产品预计2024年末至2025年初发布,期间将推出120GB水冷版H100,但据爆料到2023年底所有H100已售罄。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图6

获取H100算力主要通过云计算平台。算力云服务商如CoreWeave、Lambda从OEM采购H100后提供租赁服务,而Azure、GCP等大型云平台则直接与英伟达合作或向OEM采购。戴尔、联想等OEM厂商销售H100/HGX服务器,初创企业通常选择租赁而非自建数据中心,因为自建需考虑高昂的暗光纤线路铺设成本。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图7

云平台比较显示,Oracle云服务可靠度不及AWS、GCP、Azure三大平台,但提供更全面技术支持。AWS和GCP在InfiniBand网络建设上落后于Azure,而英伟达似乎更倾向于向非竞争性云平台分配GPU资源。私有云负责人建议初创企业优先选择预定云服务或托管云服务,并指出Oracle、Azure云服务优于GCP和AWS,但具体分配策略仍存在不确定性。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图8

英伟达通过配额制度分配H100,优先保障与自身有合作关系的AI公司。Inflection AI作为被英伟达投资的人工智能企业,通过测试CoreWeave提供的H100集群获得优先资源。当前GPU需求既包含真实需求,也存在市场炒作成分:一方面是ChatGPT等产品引发的市场追捧,另一方面是企业囤积GPU以备不时之需。无论如何,英伟达在GPU领域仍占据绝对主导地位。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图9

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图10

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图11

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图12

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图13

最新快讯

2025年10月26日

09:49
2025年10月26日,农业农村部最新农情调度数据显示,全国秋粮收获工作已取得显著进展,整体进度已超过八成。此次收获范围广泛,覆盖了我国主要粮食产区,包括黄淮海地区、东北地区、西南地区、西北地区以及长江中下游流域等关键区域。从具体作物来看,中稻收获进度已突破八成大关,玉米收获接近九成,大豆收获更是超过九成,而双季晚稻的收获工作则完成了总量的两成半。在区域分布...
09:49
协创数据技术股份有限公司于10月22日正式向香港交易所提交了上市申请,标志着这家在数据存储与AIoT智能硬件领域深耕多年的企业迈出了国际化发展的重要一步。这家成立于2005年的科技公司曾于2020年7月在深圳证券交易所创业板成功挂牌,目前其总市值已突破540亿元大关,展现出强劲的市场竞争力与投资价值。 招股书详细披露了协创数据的核心业务布局:公司专注于数据存...
09:48
UploadVR最新消息透露,三星Galaxy XR头显在应用安装方面实现了重大突破,首次支持用户直接安装APK文件。这一创新功能彻底摆脱了传统安装流程的束缚,用户无需再依赖电脑或开启繁琐的开发者模式。只需通过设备内置浏览器轻松下载APK应用文件,然后在安全设置中给予相应授权,即可完成安装,操作过程简单便捷,大大降低了用户体验门槛。 与苹果visionOS严...
09:48
日本新型H3火箭7号机于当地时间10月26日上午9时许,从鹿儿岛县种子岛宇宙中心点火升空,开启了一场备受瞩目的太空补给任务。经过约16分钟的精准飞行,火箭成功将无人货运飞船HTV-X1送入预定近地轨道,标志着此次发射任务圆满成功。值得注意的是,该任务此前曾因天气原因自21日推迟,此次顺利发射也备受外界关注。 此次发射的HTV-X1货运飞船承载着多项重要物资,...
09:12
10月25日晚间,埃及开罗至苏伊士公路发生一起严重的多车相撞事故,事故现场涉及多辆私家车与一辆重型拖车剧烈碰撞。据官方通报,此次事故已造成2名人员不幸遇难,另有42人受伤,伤者情况各异,部分伤势较重。事故发生后,当地紧急救援部门迅速响应,调集四辆救护车赶赴现场,伤者被分批送往附近医院接受紧急救治和进一步观察。目前,医疗团队正全力以赴救治伤员,同时事故原因调查...
09:12
2025年10月26日,随着寒潮席卷全国多个地区,取暖与保暖类商品迎来了销售高峰。这一季节性消费热潮不仅体现在线下实体店的热闹景象中,更在线上电商平台呈现出惊人的增长态势。根据最新市场数据显示,消费者对取暖产品的需求激增,其中台式即热饮水机与暖被机销量同比飙升超过200%,成为冬季消费市场的明星产品。与此同时,烘干机与水暖毯的销量也实现了超过100%的显著增...
09:12
2025年10月25日,备受关注的热带风暴“梅丽莎”在加勒比海区域迎来惊人转变,成功增强为一级飓风。根据美国国家飓风中心发布的最新监测报告,该飓风目前正位于海地太子港西南方向约380公里的海域,其最大持续风速已攀升至每小时120公里,展现出强大的破坏潜力。受此风暴系统的影响,伊斯帕尼奥拉岛和牙买加地区将面临严峻的强降雨挑战,并伴有严重洪灾的巨大风险,当地民众...
09:12
中国同辐股份有限公司于10月23日正式官宣第二十期上市辅导进展报告,标志着该公司正式启动进军科创板上市的征程,其辅导机构由中金公司独家负责。这家备受瞩目的企业自2021年便启动了IPO辅导备案程序,本期辅导期预计将于2025年7月至9月圆满结束。 作为中国核工业集团有限公司的重要控股子公司,中国同辐自1983年成立以来,始终致力于核科技领域的创新与发展。该公...
09:12
2025年10月26日上午9时左右,日本新一代运载火箭H3的第七号火箭从鹿儿岛县种子岛宇宙中心成功发射升空,引发全球航天界的广泛关注。此次发射任务搭载的HTV-X1无人货运飞船,肩负着验证火箭性能与开展空间运输技术试验的双重使命。值得注意的是,原定于10月21日的发射计划因突发天气原因被迫推迟,经过周密的调整与准备,本次发射最终按期顺利进行。 此次H3火箭的...
09:12
虚拟现实社交平台《VRChat》现已正式登陆iOS及安卓移动平台,为用户带来全新的线上社交体验。这一重大更新允许用户无需配备VR设备,即可在2D平面模式下参与社区互动,极大地拓宽了平台的可及性。 尽管跨平台功能已成功实现,当前移动版本仍面临一些限制。由于地图与角色建模资源的限制,用户目前只能访问少量官方跨平台地图,并且只能使用低多边形模型进行互动。这意味着大...
09:12
2025年10月26日,北方地区迎来新一波冷空气的侵袭。华北、东北及黄淮等核心区域遭遇大风降温的双重考验,内蒙古东南部更是出现5~6级的猛烈阵风,天气骤变。受此影响,当日华北与东北地区的气温降幅高达4℃~10℃,气温曲线显著下滑,最高气温10℃线南压至华北北部,部分地区最低温持续徘徊在0℃以下,寒意逼人。27日,这股冷空气将东移南下,东北东部地区预计将再次遭...
08:39
国际科研团队在距离地球约190光年的双星系统TOI-2267中,成功发现了三颗地球大小的岩石行星,这一重大发现已正式发表在权威学术期刊《天文学与天体物理学》上。该双星系统由两颗紧密环绕的恒星组成,过去一直被认为处于动态不稳定环境,难以形成稳定的行星系统。此次研究首次观测到两颗恒星各自拥有凌星行星,这一突破性成果彻底颠覆了"动态不稳定环境无法孕育行星"的传统认...