英伟达最新季度财报发布后,市场反应远超预期,不仅AMD和英特尔倍感压力,就连久经沙场的分析师也措手不及。更令人震惊的是,英伟达同比暴涨854%的收入,并非源于强劲的市场需求,而是受限于产能瓶颈。大量关于”初创公司用H100抵押贷款”的传闻背后,实则是H100 GPU供应紧张的现实。若缺货状况持续至年底,英伟达的业绩或将再创新高。
与几年前加密货币暴涨导致GPU缺货的往事不同,此次H100的短缺并非源于投机溢价,而是实实在在的产能不足。尽管英伟达在财报电话会议上强调市场份额需多方协作,实则其核心供应商SK海力士和台积电才是关键。这一直是英伟达最隐晦的”背锅”方式。
HBM内存:韩国人的游戏
从H100芯片剖面图可见,其核心区域为英伟达裸片,两侧各有三个HBM堆栈,面积与裸片相当。这六颗看似普通的内存芯片,正是H100供应短缺的症结所在。HBM(High Bandwidth Memory)本质是垂直堆叠的DRAM内存,既提升容量又优化功耗和芯片面积,却因成本问题长期未获市场青睐。
2015年,AMD Fiji系列GPU率先采用SK海力士联合研发的HBM技术,试图借4K游戏东风挑战英伟达。虽然R9 Fury X纸面性能领先,但高昂成本使其未能普及。直到AlphaGo横扫棋界,深度学习兴起,HBM才真正找到用武之地。2017年AlphaGo再战柯洁时,谷歌TPU已采用HBM设计。英伟达Tesla P100也搭载第二代HBM内存,从此高性能计算市场几乎标配HBM。
目前全球仅SK海力士、三星、美光能量产HBM,其中SK海力士独占50%市场份额,其独家供应的HBM3E更是H100的命门。单颗16GB HBM堆栈成本达240美元,H100 NVL版本仅内存芯片就价值近3000美元。更严峻的是,谷歌TPU v5和AMD MI300即将量产,同样采用HBM3E,将加剧英伟达的供应压力。
SK海力士虽计划扩产,但半导体产业扩产周期长达9-12个月。即便其他厂商跟进,HBM3E产能至少要到明年第二季度才能缓解。而即便解决了内存问题,H100的供应仍受制于台积电。
CoWoS:台积电的宝刀
据分析师测算,采用台积电4N工艺的H100,每片晶圆可切割86颗芯片,理论单颗收入155美元,实际因CoWoS封装技术可能超过1000美元。CoWoS(Chip on Wafer)技术将裸片和HBM堆栈直接拼接,通过硅中介层实现高速通信,远胜英特尔EMIB的硅桥方案。
这一技术本属台积电独有,但4000-6000美元/片的封装费用令苹果望而却步。因此台积电初期产能有限。AI浪潮爆发后,英伟达6月需求已达4.5万片,远超年初3万片的预估,产能缺口超20%。台积电虽启用先进封测六厂,但设备交期3-6个月,年底产能仍不确定。
Plan B:不存在的备选方案
尽管英伟达声称有其他供应商参与CoWoS认证,但考虑到先进封装技术门槛,只有英特尔EMIB和三星I-Cube勉强可用。面对AMD MI300的竞争,技术磨合能否及格仍是未知数。
最焦虑的是云服务商和AI初创公司。微软、亚马逊等云服务商,Anthropic、OpenAI等初创企业,以及特斯拉等科技公司,都因H100短缺面临发展危机。特斯拉FSD方案需10000块H100训练,金融公司Citadel和国内采购H800的企业同样受困。GPU Utils测算显示,当前H100供给缺口达43万张。
尽管A100性能仅H100的70%,但价格仅为1/3,但考虑到科技公司的批量采购需求,反而更不划算。AMD虽性能相近,但CUDA生态壁垒可能导致开发周期延长,使企业错失竞争优势。种种困境下,3000美元成本的H100竟供不应求,令黄仁勋也始料未及。
在HBM和CoWoS产能改善前,唯一可能的解决方案是等待依赖贷款购买H100的初创公司破产,然后低价收购其二手GPU。这或许是英伟达未预料到的市场生态。