OpenAI联合创始人兼兼职科学家Andrej Karpathy近日在公开文章中深入剖析了英伟达GPU短缺问题,引发科技界广泛关注。一张广为流传的图表揭示了各科技巨头在GPU配置上的惊人规模:GPT-4训练可能动用了10000至25000张A100 GPU,Meta拥有约21000张A100,Tesla部署了约7000张,Stability AI则使用了5000张。此外,Falcon-40B模型在384张A100上完成训练,Inflection AI则采用3500张H100和H100混合配置来打造与GPT-3.5同等性能的模型。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图

根据马斯克最新表态,GPT-5研发可能需要30000至50000张H100 GPU。尽管摩根士丹利曾预测GPT-5将使用25000张GPU并已开始训练,但Sam Altman随后澄清称GPT-5尚未启动训练。然而Altman此前曾直言GPU资源极度紧缺,表示”用户用得越少越好”,因为OpenAI根本没有足够的GPU可用。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图1

在《Nvidia H100 GPU:供需》深度分析文章中,Karpathy揭示了科技公司GPU使用现状:目前全球AI领域对H100的需求已累计约43万张。生成式AI浪潮持续高涨,对算力提出更高要求,众多初创企业纷纷采用英伟达最新推出的H100 GPU进行模型训练。马斯克甚至将GPU比作”比药物更难获得的资源”,而Altman也透露OpenAI因GPU限制推迟了多项短期计划。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图2

大型科技公司年度报告中频繁出现GPU相关议题。微软在最新财报中强调GPU是其云业务增长的”关键原材料”,并警告称基础设施短缺可能导致数据中心运营中断。据行业估算,全球企业对H100的需求总量约432000张,按每张35k美元计算,总需求规模高达150亿美元。此外,国内互联网公司对H800等高端GPU需求旺盛,而Jane Street、JP Morgan等金融巨头也纷纷部署数百至数千张A/H100 GPU。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图3

H100之所以成为首选,主要得益于其更优的技术性能:相比A100,H100在16位推理速度提升3.5倍,16位训练速度提升2.3倍,同时缓存延迟更低并支持FP8计算。尽管H100成本仅是A100的1.5-2倍,但综合系统成本优势显著。不过部分企业因成本、容量限制及现有软件兼容性等因素,仍在权衡是否升级至H100。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图4

供应链问题而非产能不足才是GPU短缺主因。英伟达高管明确指出,GPU产能主要受限于供应链,尽管英伟达全力生产,但芯片制造所需其他组件产能不足。台积电作为H100独家代工厂,其5nm产能主要分配给苹果、高通、AMD等客户,导致H100生产受限。爆料称台积电4个5nm生产节点中,H100仅使用N5或N5P的4N节点,且需与英伟达、苹果等共享产能。此外,CoWoS 3D堆叠封装技术瓶颈,以及SK Hynix等HBM内存供应商产能不足,进一步加剧了H100短缺。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图5

英伟达首席财务官Colette Kress在财报电话会议中透露,下半年GPU供应将大幅提升,但未提供具体数据。一位私有云负责人指出,GPU短缺已形成恶性循环:稀缺性导致企业囤积GPU,反而加剧了市场供需矛盾。根据英伟达路线图,H100下一代产品预计2024年末至2025年初发布,期间将推出120GB水冷版H100,但据爆料到2023年底所有H100已售罄。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图6

获取H100算力主要通过云计算平台。算力云服务商如CoreWeave、Lambda从OEM采购H100后提供租赁服务,而Azure、GCP等大型云平台则直接与英伟达合作或向OEM采购。戴尔、联想等OEM厂商销售H100/HGX服务器,初创企业通常选择租赁而非自建数据中心,因为自建需考虑高昂的暗光纤线路铺设成本。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图7

云平台比较显示,Oracle云服务可靠度不及AWS、GCP、Azure三大平台,但提供更全面技术支持。AWS和GCP在InfiniBand网络建设上落后于Azure,而英伟达似乎更倾向于向非竞争性云平台分配GPU资源。私有云负责人建议初创企业优先选择预定云服务或托管云服务,并指出Oracle、Azure云服务优于GCP和AWS,但具体分配策略仍存在不确定性。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图8

英伟达通过配额制度分配H100,优先保障与自身有合作关系的AI公司。Inflection AI作为被英伟达投资的人工智能企业,通过测试CoreWeave提供的H100集群获得优先资源。当前GPU需求既包含真实需求,也存在市场炒作成分:一方面是ChatGPT等产品引发的市场追捧,另一方面是企业囤积GPU以备不时之需。无论如何,英伟达在GPU领域仍占据绝对主导地位。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图9

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图10

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图11

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图12

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图13

最新快讯

2025年08月05日

10:59
浙江大学脑机智能全国重点实验室近日震撼发布全球规模最大的类脑计算机——Darwin Monkey(悟空),这一划时代的突破标志着类脑计算技术正式迈入全新纪元。该计算机拥有超过20亿个脉冲神经元和1000亿突触连接,首次在工程系统中实现了接近猕猴大脑的神经元规模,为人工智能和神经科学研究开辟了前所未有的崭新路径。 技术架构:Darwin3芯片驱动的计算革命 悟...
10:59
硅谷创新企业OpenMind正引领一场机器人行业的软件革命。与众多聚焦硬件研发的同行不同,OpenMind将目光锁定在机器人的"大脑"上——他们正在开发名为OM1的机器人操作系统,立志成为机器人领域的"安卓系统"。这一战略转型标志着机器人行业正从硬件竞赛转向软件生态建设的新纪元。 当前机器人行业的竞争格局主要集中在硬件层面,包括运动控制、物体抓取、环境交互等...
10:59
麦当劳(MCD)近日正式宣布一项雄心勃勃的战略计划,目标是在2027年前将其人工智能(AI)应用规模扩大一倍,而印度将在这场全球布局中扮演核心角色。作为这一战略的关键落子,麦当劳已将印度海得拉巴选定为美国以外的全球最大办公中心,该中心将全面聚焦于数据治理、工程开发以及平台架构建设等前沿技术领域。图源备注:图片由AI生成,图片授权服务商Midjourney 麦...
10:59
2025年8月5日,一则重磅商业交易消息在业界引发广泛关注。据资深行业分析师透露,全球顶级投资银行高盛正计划斥资150亿欧元,从法国私募巨头PAI手中收购全球第二大冰激凌生产商Froneri的控股权。这一潜在交易若最终落成,不仅将深刻改变欧洲食品行业的竞争格局,更可能对全球冰激凌市场的版图产生深远影响。 Froneri作为欧洲冰激凌市场的领军企业,其独特之处...
10:59
2025年8月5日,北京时间,金融市场迎来剧烈波动。受美国就业数据意外大幅下调的冲击,市场对美联储9月降息的预期急剧升温,直接推动贵金属价格全线上涨。黄金、白银和铂金等避险资产在避险情绪的推动下表现强劲,投资者纷纷涌入这些传统避险市场寻求保护。 然而,贺利氏最新发布的市场分析报告却揭示了另一面:黄金、白银和铂金的需求正显现短期疲软的迹象。数据显示,今年上半年...
10:59
2025年8月5日午间收盘,日本股市呈现稳健上涨态势。日经225指数以40544.99点报收,涨幅达到0.63%,显示出市场投资者的积极情绪。与此同时,日本东证指数表现更为强劲,收于2938.27点,涨幅高达0.8%,进一步印证了市场整体的良好表现。此次午间收盘数据不仅反映了日本经济的复苏迹象,也为全球投资者提供了重要的市场参考。随着全球经济形势的不断变化,...
10:59
中航材华顺航空资源服务(北京)有限公司近日正式宣告成立,注册资本高达20亿元人民币,彰显了其在航空领域的雄厚实力与战略布局。该公司由中国航空器材集团有限公司全资控股,法定代表人伍德海先生亲自挂帅,预示着将依托集团强大的资源优势,开启航空资源服务的新篇章。 公司业务范围广泛多元,全面覆盖航空运输设备销售、航空运营支持服务、民用航空材料销售以及保税仓库经营等多个...
10:59
今日,创新药概念板块经历了一波强劲的冲高后,出现了明显的回落走势,这一波动迅速吸引了市场的广泛关注。在板块整体调整的过程中,多只处于高位的股票出现了大幅下挫,其中昂利康的股价更是逼近跌停线,而南新制药、华森制药、悦康药业、辰欣药业、贵州百灵、舒泰神等公司的股价跌幅均超过了6%。市场分析人士指出,此次板块的调整很可能与前期涨幅过大有关,随着获利盘的集中涌出,投...
10:59
2025年8月5日,日本信州大学传来一项突破性研究成果,一种名为LAHB的新型环保塑料成功在深海环境中实现微生物降解,最终分解为无害的二氧化碳和水。这一发现不仅为海洋塑料污染治理提供了全新解决方案,更标志着生物可降解材料研发领域迈出了重要一步。该塑料由经过基因改造的大肠杆菌工程菌合成,此前已在河水和浅海环境中展现出优异的降解性能。通过引入深海微生物群落进行实...
10:59
8月4日,全球知名慈善机构比尔及梅琳达·盖茨基金会正式宣布一项雄心勃勃的计划,将在未来十年内投入高达25亿美元的资金,全面加速女性健康领域的创新研发进程。这笔巨额投资将聚焦于五大关键领域,分别是产科护理、孕产妇健康、妇科与经期健康、避孕技术以及性传播感染防治,旨在通过科技创新为全球女性提供更安全、更有效的健康解决方案。 作为该基金会性别平等部门的负责人,扎伊...
10:59
《科创板日报》8月5日讯 米哈游联合创始人蔡浩宇倾力打造的二次创业力作《Whispers from the Star》将于8月15日正式登陆Steam平台,首发售价定为9.99美元,初期仅提供英文版本。这款备受瞩目的游戏以"AI实时交互"为核心创新玩法,开创性地让玩家能够通过深度对话与虚拟角色Stella建立真挚的情感纽带。Stella不仅拥有强大的记忆存储...
10:59
2025年8月5日,中欣氟材通过官方互动平台发布重要动态,宣布公司正全力推进轻量化相关材料的市场拓展与认证工作。这一战略举措旨在积极应对当前快速增长的轻量化材料市场需求,通过加速产品布局和技术创新,进一步提升公司在该领域的核心竞争力与行业影响力。随着汽车、航空航天等行业的轻量化趋势日益显著,中欣氟材此举不仅彰显了其敏锐的市场洞察力,更体现了公司致力于推动绿色...