OpenAI联合创始人兼兼职科学家Andrej Karpathy近日在公开文章中深入剖析了英伟达GPU短缺问题,引发科技界广泛关注。一张广为流传的图表揭示了各科技巨头在GPU配置上的惊人规模:GPT-4训练可能动用了10000至25000张A100 GPU,Meta拥有约21000张A100,Tesla部署了约7000张,Stability AI则使用了5000张。此外,Falcon-40B模型在384张A100上完成训练,Inflection AI则采用3500张H100和H100混合配置来打造与GPT-3.5同等性能的模型。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图

根据马斯克最新表态,GPT-5研发可能需要30000至50000张H100 GPU。尽管摩根士丹利曾预测GPT-5将使用25000张GPU并已开始训练,但Sam Altman随后澄清称GPT-5尚未启动训练。然而Altman此前曾直言GPU资源极度紧缺,表示”用户用得越少越好”,因为OpenAI根本没有足够的GPU可用。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图1

在《Nvidia H100 GPU:供需》深度分析文章中,Karpathy揭示了科技公司GPU使用现状:目前全球AI领域对H100的需求已累计约43万张。生成式AI浪潮持续高涨,对算力提出更高要求,众多初创企业纷纷采用英伟达最新推出的H100 GPU进行模型训练。马斯克甚至将GPU比作”比药物更难获得的资源”,而Altman也透露OpenAI因GPU限制推迟了多项短期计划。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图2

大型科技公司年度报告中频繁出现GPU相关议题。微软在最新财报中强调GPU是其云业务增长的”关键原材料”,并警告称基础设施短缺可能导致数据中心运营中断。据行业估算,全球企业对H100的需求总量约432000张,按每张35k美元计算,总需求规模高达150亿美元。此外,国内互联网公司对H800等高端GPU需求旺盛,而Jane Street、JP Morgan等金融巨头也纷纷部署数百至数千张A/H100 GPU。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图3

H100之所以成为首选,主要得益于其更优的技术性能:相比A100,H100在16位推理速度提升3.5倍,16位训练速度提升2.3倍,同时缓存延迟更低并支持FP8计算。尽管H100成本仅是A100的1.5-2倍,但综合系统成本优势显著。不过部分企业因成本、容量限制及现有软件兼容性等因素,仍在权衡是否升级至H100。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图4

供应链问题而非产能不足才是GPU短缺主因。英伟达高管明确指出,GPU产能主要受限于供应链,尽管英伟达全力生产,但芯片制造所需其他组件产能不足。台积电作为H100独家代工厂,其5nm产能主要分配给苹果、高通、AMD等客户,导致H100生产受限。爆料称台积电4个5nm生产节点中,H100仅使用N5或N5P的4N节点,且需与英伟达、苹果等共享产能。此外,CoWoS 3D堆叠封装技术瓶颈,以及SK Hynix等HBM内存供应商产能不足,进一步加剧了H100短缺。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图5

英伟达首席财务官Colette Kress在财报电话会议中透露,下半年GPU供应将大幅提升,但未提供具体数据。一位私有云负责人指出,GPU短缺已形成恶性循环:稀缺性导致企业囤积GPU,反而加剧了市场供需矛盾。根据英伟达路线图,H100下一代产品预计2024年末至2025年初发布,期间将推出120GB水冷版H100,但据爆料到2023年底所有H100已售罄。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图6

获取H100算力主要通过云计算平台。算力云服务商如CoreWeave、Lambda从OEM采购H100后提供租赁服务,而Azure、GCP等大型云平台则直接与英伟达合作或向OEM采购。戴尔、联想等OEM厂商销售H100/HGX服务器,初创企业通常选择租赁而非自建数据中心,因为自建需考虑高昂的暗光纤线路铺设成本。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图7

云平台比较显示,Oracle云服务可靠度不及AWS、GCP、Azure三大平台,但提供更全面技术支持。AWS和GCP在InfiniBand网络建设上落后于Azure,而英伟达似乎更倾向于向非竞争性云平台分配GPU资源。私有云负责人建议初创企业优先选择预定云服务或托管云服务,并指出Oracle、Azure云服务优于GCP和AWS,但具体分配策略仍存在不确定性。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图8

英伟达通过配额制度分配H100,优先保障与自身有合作关系的AI公司。Inflection AI作为被英伟达投资的人工智能企业,通过测试CoreWeave提供的H100集群获得优先资源。当前GPU需求既包含真实需求,也存在市场炒作成分:一方面是ChatGPT等产品引发的市场追捧,另一方面是企业囤积GPU以备不时之需。无论如何,英伟达在GPU领域仍占据绝对主导地位。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图9

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图10

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图11

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图12

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图13

最新快讯

2026年02月10日

18:15
微新创想 vivo Pad6 Pro已经正式获得入网许可。这款新品配备了一块13英寸的巨型屏幕,为用户带来更广阔的视觉体验。同时,它搭载了高通第五代骁龙8至尊版(骁龙8E5)旗舰平台,性能方面实现了全面升级。作为一款定位巨屏生产力的旗舰设备,vivo Pad6 Pro也是蓝厂历史上性能最强悍的平板电脑。 回顾去年4月份发布的vivo Pad5 Pro,当时该...
18:15
微新创想 iQOO Z11系列已经正式获得入网许可 该系列涵盖了iQOO Z11和iQOO Z11X两款机型 内部型号为V2551A 其中备受关注的iQOO Z11X采用了一块6 76英寸的LCD高刷屏 分辨率达到FHD级别 该机搭载了高通骁龙7s Gen4平台 被视为iQOO在2026年专门为千元档位打造的LCD神机 对比目前主流的OLED面板 LCD...
18:12
微新创想:随着全球企业产生的视频数据量达到前所未有的高度 如何处理那些被长期封存 从未被观看或分析过的“暗数据”已成为行业新挑战 近日 由两名前谷歌资深员工创办的东京初创公司 InfiniMind 宣布 已成功筹集 580 万美元种子轮融资 该公司正致力于构建一种全新的 AI 基础设施 旨在将 PB 级别的原始视频和音频转化为可搜索 可结构化的商业智能数据 ...
18:12
微新创想:在全球AI短剧的热浪中,昆仑万维再次展现了其强大的统治力。继2024年底投资5亿美金杀入海外短剧赛道后,该公司近期宣布追加千万美金,旨在深耕并强化海外AI短剧的创作生态。这一系列动作不仅彰显了昆仑万维对AI内容产业的重视,也预示着其在该领域持续扩张的决心。 MAU突破8000万,AI短剧“吸金”能力惊人。昆仑万维旗下的DramaWave和FreeR...
18:00
微新创想:2月9日,为恒智能科技股份有限公司向港交所递交IPO招股书,华泰国际与招银国际担任联席保荐人。公司专注数智化工商业储能解决方案,依托自研能源管理算法及全栈技术框架服务全球客户。截至2025年9月30日九个月,其中国工商业储能出货量居全国第八、海外第三。 2023—2024年收入分别为2.67亿、2.68亿元;2025年前三季度收入达4.76亿元,同...
18:00
微新创想:2026年2月10日,Anker安克在欧洲市场正式发售soundcore Nebula X1 Pro 4K投影仪 这款投影仪采用推车式设计,整机重量为32.8千克,配备滚轮与提手,便于用户在不同场景下移动使用 其搭载三重激光光源,亮度高达3500流明(ANSI),能够满足多种照明环境下的投影需求 支持最大300英寸投射,投射比范围为0.9–1.5:...
18:00
微新创想:2026年2月10日,联发科技发布2026年1月营收报告。当月合并营收为469.77亿新台币(约合103.77亿元人民币),同比下滑8.15%,环比下滑8.37%。 微新创想:尽管营收出现下滑,联发科技仍表示正在加速推进数据中心ASIC业务的发展。公司指出,这一业务领域是其未来增长的重要方向,预计在2028年起,下一代产品将开始产生收入。 微新创想...
18:00
微新创想:2026年2月,杭州科技企业安晴人工智能完成天使轮融资,投资方为浙商创投。公司专注于人工智能技术开发及医疗科技融合应用,致力于构建‘AI+医疗’技术生态。本轮融资将用于加速核心算法研发、医疗合规认证及临床场景落地。公司注册地为浙江杭州,团队由AI与医学交叉领域资深工程师及临床专家组成。此次融资标志着其技术产业化进程进入新阶段。
18:00
微新创想:2025年第四季度,中芯国际实现营收178.13亿元,同比增长11.9%。归母净利润达到12.23亿元,同比增长23.2%。营业利润为21.14亿元,但与去年同期相比下降了23.0%。毛利率维持在17.4%的水平。 按国际财务报告准则,当季销售收入为24.89亿美元,环比增长4.5%。产能利用率保持在95.7%。全年来看,中芯国际2025年总营收为...
18:00
微新创想:2026年2月,智蜂医药宣布完成A+轮融资,由普华资本投资。此次融资标志着公司在医药科技领域迈出了重要的一步,进一步巩固了其在行业内的领先地位。 该公司以医药科技为核心,专注于医学研究与生物化工技术的研发,致力于推动科研成果向实际应用的转化。凭借强大的技术实力和创新能力,智蜂医药在多个领域取得了显著进展,并成功持有医疗器械销售及进出口资质,为其业务...
18:00
微新创想:2026年2月9日,蔚来召开全员会议,创始人李斌宣布力争2026年实现Non-GAAP口径全年盈利。此前公司预告2025年四季度Non-GAAP经营利润为7亿至12亿元,显示出公司在财务表现上的显著改善。 李斌指出,2025年团队完成关键突破,为公司未来的增长奠定了坚实基础。这一阶段的成绩不仅体现在业绩数据上,更反映在产品创新、市场拓展以及用户体验...
18:00
微新创想:2026年2月10日 加拿大布鲁克菲尔德资产管理公司正与美国黑石集团就收购其西班牙房地产子公司Fidere展开谈判 交易估值约10亿欧元(约合12亿美元) 地点为西班牙 此举旨在扩大布鲁克菲尔德在欧洲核心市场的不动产布局 增强其在南欧租赁住宅及物流资产领域的组合实力 若达成 该交易将成为2026年西班牙房地产领域迄今规模最大的并购案之一