OpenAI联合创始人兼兼职科学家Andrej Karpathy近日在公开文章中深入剖析了英伟达GPU短缺问题,引发科技界广泛关注。一张广为流传的图表揭示了各科技巨头在GPU配置上的惊人规模:GPT-4训练可能动用了10000至25000张A100 GPU,Meta拥有约21000张A100,Tesla部署了约7000张,Stability AI则使用了5000张。此外,Falcon-40B模型在384张A100上完成训练,Inflection AI则采用3500张H100和H100混合配置来打造与GPT-3.5同等性能的模型。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图

根据马斯克最新表态,GPT-5研发可能需要30000至50000张H100 GPU。尽管摩根士丹利曾预测GPT-5将使用25000张GPU并已开始训练,但Sam Altman随后澄清称GPT-5尚未启动训练。然而Altman此前曾直言GPU资源极度紧缺,表示”用户用得越少越好”,因为OpenAI根本没有足够的GPU可用。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图1

在《Nvidia H100 GPU:供需》深度分析文章中,Karpathy揭示了科技公司GPU使用现状:目前全球AI领域对H100的需求已累计约43万张。生成式AI浪潮持续高涨,对算力提出更高要求,众多初创企业纷纷采用英伟达最新推出的H100 GPU进行模型训练。马斯克甚至将GPU比作”比药物更难获得的资源”,而Altman也透露OpenAI因GPU限制推迟了多项短期计划。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图2

大型科技公司年度报告中频繁出现GPU相关议题。微软在最新财报中强调GPU是其云业务增长的”关键原材料”,并警告称基础设施短缺可能导致数据中心运营中断。据行业估算,全球企业对H100的需求总量约432000张,按每张35k美元计算,总需求规模高达150亿美元。此外,国内互联网公司对H800等高端GPU需求旺盛,而Jane Street、JP Morgan等金融巨头也纷纷部署数百至数千张A/H100 GPU。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图3

H100之所以成为首选,主要得益于其更优的技术性能:相比A100,H100在16位推理速度提升3.5倍,16位训练速度提升2.3倍,同时缓存延迟更低并支持FP8计算。尽管H100成本仅是A100的1.5-2倍,但综合系统成本优势显著。不过部分企业因成本、容量限制及现有软件兼容性等因素,仍在权衡是否升级至H100。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图4

供应链问题而非产能不足才是GPU短缺主因。英伟达高管明确指出,GPU产能主要受限于供应链,尽管英伟达全力生产,但芯片制造所需其他组件产能不足。台积电作为H100独家代工厂,其5nm产能主要分配给苹果、高通、AMD等客户,导致H100生产受限。爆料称台积电4个5nm生产节点中,H100仅使用N5或N5P的4N节点,且需与英伟达、苹果等共享产能。此外,CoWoS 3D堆叠封装技术瓶颈,以及SK Hynix等HBM内存供应商产能不足,进一步加剧了H100短缺。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图5

英伟达首席财务官Colette Kress在财报电话会议中透露,下半年GPU供应将大幅提升,但未提供具体数据。一位私有云负责人指出,GPU短缺已形成恶性循环:稀缺性导致企业囤积GPU,反而加剧了市场供需矛盾。根据英伟达路线图,H100下一代产品预计2024年末至2025年初发布,期间将推出120GB水冷版H100,但据爆料到2023年底所有H100已售罄。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图6

获取H100算力主要通过云计算平台。算力云服务商如CoreWeave、Lambda从OEM采购H100后提供租赁服务,而Azure、GCP等大型云平台则直接与英伟达合作或向OEM采购。戴尔、联想等OEM厂商销售H100/HGX服务器,初创企业通常选择租赁而非自建数据中心,因为自建需考虑高昂的暗光纤线路铺设成本。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图7

云平台比较显示,Oracle云服务可靠度不及AWS、GCP、Azure三大平台,但提供更全面技术支持。AWS和GCP在InfiniBand网络建设上落后于Azure,而英伟达似乎更倾向于向非竞争性云平台分配GPU资源。私有云负责人建议初创企业优先选择预定云服务或托管云服务,并指出Oracle、Azure云服务优于GCP和AWS,但具体分配策略仍存在不确定性。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图8

英伟达通过配额制度分配H100,优先保障与自身有合作关系的AI公司。Inflection AI作为被英伟达投资的人工智能企业,通过测试CoreWeave提供的H100集群获得优先资源。当前GPU需求既包含真实需求,也存在市场炒作成分:一方面是ChatGPT等产品引发的市场追捧,另一方面是企业囤积GPU以备不时之需。无论如何,英伟达在GPU领域仍占据绝对主导地位。

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图9

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图10

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图11

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图12

GPT-5需5万张H100 GPU短缺风暴来袭 全球需求达43万张插图13

最新快讯

2026年02月10日

20:03
微新创想:2026年2月10日,英特尔正式发布Wi-Fi驱动更新包24.20.0 该版本驱动适配Windows 10 64位及Windows 11操作系统 对应驱动版本为24.20.0.4 此次更新标志着英特尔在无线网络技术领域迈出了重要一步 该版本首次支持BE211、BE213等新一代Wi-Fi 7网卡 同时确认Wi-Fi 7完整功能需Windows 11...
20:03
微新创想:2026年2月9日,美国加州北区法院文件显示,OpenAI因商标纠纷决定不在任何AI硬件产品中使用“io”或“IYO”名称。此举源于音频初创公司iyO发起的侵权诉讼。 公司副总裁Peter Welinder确认,首款无屏桌面AI硬件将不早于2027年2月28日面向消费者发货。目前该设备仍处原型阶段,尚未启动包装与营销材料制作。 原计划中,这款AI硬...
20:03
微新创想:2026年1月30日,摩尔线程宣布开源TileLang-MUSA项目,今日再次发布。该项目实现了对高层张量分块编程语言TileLang的完整支持,并已在MTT S5000、S4000等国产GPU平台上完成验证。TileLang采用类似Python的声明式语法,使得开发者能够以更简洁的方式表达复杂的张量操作。 微新创想:TileLang支持自动循环优...
20:03
微新创想:2026年2月3日,韩国媒体报道称Nexon已与暴雪达成合作,正式启动基于《星际争霸》IP的新游戏项目。这一消息引起了业界广泛关注,标志着Nexon在游戏开发领域迈出了重要一步。 该项目由Nexon射击事业本部主导,计划采用第一人称射击(FPS)或第三人称射击(TPS)玩法,而非传统的即时战略(RTS)模式。这一选择表明Nexon希望将《星际争霸》...
20:03
微新创想:2026年2月6日,户外品牌KOLON SPORT可隆在北京华贸购物中心正式启用品牌体验旗舰店“KOLON ATLAS可隆自然典集”。这一全新门店由品牌自主打造,致力于通过沉浸式空间展现自然探索的核心理念。店内不仅展示了可隆最新的产品系列,还融入了丰富的文化互动元素和生活方式体验,为顾客带来全方位的感官享受。 旗舰店选址于北京核心商业区,精准定位都...
20:03
微新创想:2026年2月10日,阿里云宣布通过ICANN全面技术评估,成为中国首家具备顶级域名全链路服务能力的云服务商 阿里云此次通过评估,标志着其在顶级域名服务领域达到了国际领先水平。该认证覆盖了新顶级域名申请、域名资产管理、DNS解析、安全防护以及云部署等多个关键环节,为用户提供了一站式的解决方案 此前,企业在申请地域性顶级域名时往往需要与多个机构进行协...
19:02
微新创想:2026年2月10日,国际DRAM现货市场整体持稳,DDR5部分颗粒结束连续数日小幅下跌,出现温和反弹。市场情绪有所回暖,显示出一定的复苏迹象。 DDR5 16Gb(2Gx8)4800/5600规格颗粒价格上涨0.41%,均价达到38美元。这一涨幅虽然不大,但标志着市场开始对近期的供需变化做出反应。 同容量的eTT版本颗粒也出现了上涨,涨幅为0.5...
19:02
微新创想:2026年2月10日,制造商Musnap在海外正式推出Ocean C彩色墨水屏电纸书。这款设备采用了7英寸的Kaleido 3面板,具备300PPI的黑白显示和150PPI的彩色显示,为用户带来更清晰细腻的阅读体验。其硬件配置也相当扎实,搭载了8核处理器、4GB RAM以及64GB存储空间,能够流畅运行安卓14系统。 微新创想:Ocean C不仅在...
19:02
微新创想:2026年2月10日,四川资阳乐至县太平2号特大桥现场传来喜讯,中铁十九局成功完成最后一孔箱梁的架设工作,标志着成渝中线高铁四川段桥梁工程全面竣工。这一重要节点的达成,不仅为后续的铺轨作业和联调联试提供了坚实基础,也意味着整个项目正式迈入全面冲刺阶段。 此次桥梁工程由长江沿岸铁路集团四川有限公司负责建设管理,覆盖四川境内的全线桥梁结构。作为成渝中线...
19:02
微新创想:2026年2月10日,上海召开年度市重大工程建设工作会议。全市共安排重大工程正式项目184项、预备项目14项,计划新开工16项、基本建成22项,年度投资2550亿元,创历史新高。此次会议标志着上海在推动城市高质量发展方面迈出了坚实一步。 微新创想:项目聚焦“五个中心”建设,涵盖科技创新、产业升级、基础设施完善、文化教育提升、医疗卫生优化、生态环境改...
19:02
微新创想:2026年2月10日 大位科技发布异动公告回应市场误读 大位科技(600589.SH)在2026年2月10日发布公告 明确回应市场对其算力租赁概念的误解 公司股票在2026年2月6日、9日、10日连续三日涨幅偏离值超过20% 引起投资者广泛关注 面对市场对算力租赁业务的猜测 公司在公告中强调其相关业务收入占比并不高 2024年前三季度 大位科技的算...
19:02
微新创想:2026年2月10日,由世茂集团商业地产商娱公司与章丘控股集团联合打造的章丘世茂广场在济南市章丘区东部核心板块正式开业。项目总建筑面积约14万平方米,定位为区域旗舰级城市综合体,涵盖商业零售、休闲娱乐、餐饮及服务等多种业态。选址依托高阶居住人群集聚区,旨在提升东部片区商业能级与消费体验。该项目是目前章丘规模最大的城市综合体,标志着区域商业升级迈出关...