OpenAI联合创始人兼兼职科学家Andrej Karpathy近日在公开文章中深入剖析了英伟达GPU短缺问题,引发科技界广泛关注。一张广为流传的图表揭示了各科技巨头在GPU配置上的惊人规模:GPT-4训练可能动用了10000至25000张A100 GPU,Meta拥有约21000张A100,Tesla部署了约7000张,Stability AI则使用了5000张。此外,Falcon-40B模型在384张A100上完成训练,Inflection AI则采用3500张H100和H100混合配置来打造与GPT-3.5同等性能的模型。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图

根据马斯克最新表态,GPT-5研发可能需要30000至50000张H100 GPU。尽管摩根士丹利曾预测GPT-5将使用25000张GPU并已开始训练,但Sam Altman随后澄清称GPT-5尚未启动训练。然而Altman此前曾直言GPU资源极度紧缺,表示”用户用得越少越好”,因为OpenAI根本没有足够的GPU可用。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图1

在《Nvidia H100 GPU:供需》深度分析文章中,Karpathy揭示了科技公司GPU使用现状:目前全球AI领域对H100的需求已累计约43万张。生成式AI浪潮持续高涨,对算力提出更高要求,众多初创企业纷纷采用英伟达最新推出的H100 GPU进行模型训练。马斯克甚至将GPU比作”比药物更难获得的资源”,而Altman也透露OpenAI因GPU限制推迟了多项短期计划。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图2

大型科技公司年度报告中频繁出现GPU相关议题。微软在最新财报中强调GPU是其云业务增长的”关键原材料”,并警告称基础设施短缺可能导致数据中心运营中断。据行业估算,全球企业对H100的需求总量约432000张,按每张35k美元计算,总需求规模高达150亿美元。此外,国内互联网公司对H800等高端GPU需求旺盛,而Jane Street、JP Morgan等金融巨头也纷纷部署数百至数千张A/H100 GPU。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图3

H100之所以成为首选,主要得益于其更优的技术性能:相比A100,H100在16位推理速度提升3.5倍,16位训练速度提升2.3倍,同时缓存延迟更低并支持FP8计算。尽管H100成本仅是A100的1.5-2倍,但综合系统成本优势显著。不过部分企业因成本、容量限制及现有软件兼容性等因素,仍在权衡是否升级至H100。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图4

供应链问题而非产能不足才是GPU短缺主因。英伟达高管明确指出,GPU产能主要受限于供应链,尽管英伟达全力生产,但芯片制造所需其他组件产能不足。台积电作为H100独家代工厂,其5nm产能主要分配给苹果、高通、AMD等客户,导致H100生产受限。爆料称台积电4个5nm生产节点中,H100仅使用N5或N5P的4N节点,且需与英伟达、苹果等共享产能。此外,CoWoS 3D堆叠封装技术瓶颈,以及SK Hynix等HBM内存供应商产能不足,进一步加剧了H100短缺。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图5

英伟达首席财务官Colette Kress在财报电话会议中透露,下半年GPU供应将大幅提升,但未提供具体数据。一位私有云负责人指出,GPU短缺已形成恶性循环:稀缺性导致企业囤积GPU,反而加剧了市场供需矛盾。根据英伟达路线图,H100下一代产品预计2024年末至2025年初发布,期间将推出120GB水冷版H100,但据爆料到2023年底所有H100已售罄。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图6

获取H100算力主要通过云计算平台。算力云服务商如CoreWeave、Lambda从OEM采购H100后提供租赁服务,而Azure、GCP等大型云平台则直接与英伟达合作或向OEM采购。戴尔、联想等OEM厂商销售H100/HGX服务器,初创企业通常选择租赁而非自建数据中心,因为自建需考虑高昂的暗光纤线路铺设成本。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图7

云平台比较显示,Oracle云服务可靠度不及AWS、GCP、Azure三大平台,但提供更全面技术支持。AWS和GCP在InfiniBand网络建设上落后于Azure,而英伟达似乎更倾向于向非竞争性云平台分配GPU资源。私有云负责人建议初创企业优先选择预定云服务或托管云服务,并指出Oracle、Azure云服务优于GCP和AWS,但具体分配策略仍存在不确定性。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图8

英伟达通过配额制度分配H100,优先保障与自身有合作关系的AI公司。Inflection AI作为被英伟达投资的人工智能企业,通过测试CoreWeave提供的H100集群获得优先资源。当前GPU需求既包含真实需求,也存在市场炒作成分:一方面是ChatGPT等产品引发的市场追捧,另一方面是企业囤积GPU以备不时之需。无论如何,英伟达在GPU领域仍占据绝对主导地位。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图9

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图10

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图11

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图12

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图13

最新快讯

2025年10月28日

12:32
REDMI Watch 6重磅发布,售价仅为599元,为智能手表市场注入强劲活力。10月28日,小米集团手机部副总裁、可穿戴部总经理张雷通过微博积极回应了用户对这款产品的诸多关注点,进一步揭示了其强大功能与丰富应用场景。 这款手表搭载最新的小米澎湃OS 3系统,实现了与手机超级岛的深度同步。用户不仅能够实时查看打车、外卖、快递等生活服务的最新进度,更可在后续...
12:32
微新创想10月28日重磅报道,智能穿戴领域迎来颠覆性创新——追觅正式发布全球首款震动AI智能戒指Dreame Ring,标志着这家科技巨头强势进军智能戒指市场。这款备受瞩目的产品现已登陆京东商城,首发售价2599元,为用户带来前所未有的智能体验。 Dreame Ring在材质工艺上精益求精,采用航空级陶瓷材质打造,不仅外观时尚,更具备5ATM级防水性能,无论...
12:31
2025年10月28日,备受瞩目的国网新源江苏句容抽水蓄能电站正式全面投产发电,标志着我国清洁能源发展迈入新阶段。这座位于江苏省句容市的核心能源工程,总装机容量高达135万千瓦,设计年发电量达13.5亿千瓦时,为长三角地区注入了强大的绿色动力,成为该区域不可或缺的清洁能源调节设施。尤为瞩目的是,该电站拥有世界坝体最高的技术突破,其建成不仅彰显了我国在高坝蓄能...
12:31
10月27日,合肥市师范附属小学迎来了一位特殊的"助教"——全球首款正式进入课堂教学场景的全尺寸仿生机器人"小安"。在《设计我们的乐器》科学课堂上,这位身高1.4米的机器人凭借其先进的语音应答和视觉识别功能,为教师开展互动教学提供了有力支持。据研发方无论科技透露,"小安"搭载了34自由度灵巧硬件组件,并集成了表情生成系统与人格定制引擎,能够实现与学生的情绪同...
12:31
最新消息显示,谷歌可能将备受期待的Pixel系列功能更新——Pixel Drop,从原定的12月提前至11月4日正式推送。这一突如其来的时间调整,无疑让全球Pixel用户感到惊喜,也预示着谷歌将带来一系列令人耳目一新的升级体验。 此次Pixel Drop更新将包含三大核心亮点,全方位提升用户的个性化体验和创作能力。首先,谷歌将首次引入"Pixel主题包"功能...
12:31
2025年1月至9月,小鹏汽车在海外市场取得了令人瞩目的成绩,累计交付量高达29,706辆,同比增长超过125%。这一亮眼表现充分彰显了其国际化战略的显著成效,标志着小鹏汽车在全球市场版图上的加速扩张。值得注意的是,欧洲及东南亚市场成为小鹏汽车海外增长的主要引擎,贡献了绝大部分增量。得益于精准的本地化服务策略和完善的渠道建设,小鹏汽车正逐步构建起覆盖全球的营...
12:31
截至10月27日,黑龙江省农作物收获工作已取得显著进展,整体完成率达99.2%。今年,面对短时雨雪天气带来的挑战,黑龙江省积极采取应对措施,科学规划并有序推进秋收作业。得益于此,大豆和水稻的收获时间较去年平均提前了3至5天,而玉米作物的大面积收获更是提前了整整3天完成。目前,全省范围内仅有少量玉米地块因天气原因仍需等待冻后收获,但秋收生产大局已基本收官,丰收...
12:31
2025年10月28日,中国人民银行在公开市场执行了一项规模达4753亿元人民币的7天期逆回购操作,并宣布维持操作利率在1.40%的稳定水平。与此同时,当日有1595亿元人民币的逆回购额度到期。通过此次操作,央行成功向市场注入了3158亿元人民币的流动性,有效保障了银行体系的资金供给,实现了净投放目标。 此次逆回购操作采用利率招标方式进行,充分展现了央行...
12:31
最新消息显示,三星正积极推动One UI 8.5系统的迭代升级,重点强化图库编辑功能的智能化与便捷性。据科技博主@Tarunvats于10月26日在X平台发布的演示视频曝光,此次系统更新将革命性地整合"对象橡皮擦"功能至"生成式编辑"工作流中。用户现在只需通过AI智能识别并选择目标对象,即可实现一键移除照片中多余的人物、干扰物或背景阴影,整个过程无需切换工具...
12:31
2025年10月28日,上海证券交易所隆重举行科创板科创成长层首批新注册企业上市仪式,标志着中国资本市场在支持科技创新方面迈出了又一关键步伐。上交所理事长邱勇在致辞中强调,将坚定不移地探索符合科技创新内在规律的监管方式,以更加灵活和精准的手段护航科技企业成长。这一系列举措的核心目标在于显著提振市场对科创企业的信心与预期,为科技企业营造更加有利的融资环境,从而...
12:31
上海交通大学环境科学与工程学院赵一新教授团队在《Nature》杂志上发表了具有里程碑意义的研究成果,创新性地提出了"基质限域分子层"型空穴传输层构型设计。该技术突破性地采用三(五氟苯基)硼烷分子作为主体骨架,通过精密的分子工程策略有效抑制了传统自组装单分子层体系中普遍存在的分子聚集缺陷,从而显著提升了薄膜的均匀性和界面稳定性,为钙钛矿太阳能电池的性能优化提供...
12:00
10月26日,江西上饶的李女士与朋友在擂鼓岭山区进行徒步探险时,意外发现一处直径约50厘米的落叶堆积区。该区域地面松软且富有弹性,表面特征与天然蹦床极为相似。出于好奇,两人多次在上面蹦跳并拍摄视频,却未意识到危险正悄然逼近。 然而,危险很快显现——她们在附近遭遇两条蛇的袭击。其中一条呈棕黑色,身形粗壮如木棍;另一条头部扁平,具备眼镜蛇典型的特征。面对突如其来...