2023年8月3日,华尔街与硅谷联手创造了一项震撼业界的壮举:一家创业公司成功获得了23亿美元的债务融资,其抵押物是全球最硬的通货——英伟达H100显卡。这家备受瞩目的公司名为CoreWeave,主营业务是AI私有云服务,通过构建拥有海量GPU算力的数据中心,为AI创业公司和大型商业客户提供算力基础设施。截至目前,CoreWeave累计融资5.8亿美元,目前处于B轮融资阶段,估值高达20亿美元。

CoreWeave成立于2016年,由三位华尔街大宗商品交易员共同创立。公司最初的主营业务是挖矿,通过采购大量GPU组建矿机中心,尤其在币圈低潮时,会逆周期囤积大量显卡,也因此与英伟达建立了深厚的合作关系。2019年,CoreWeave开始将这些矿机改造为企业级数据中心,向客户提供AI云服务。尽管初期业务发展并不温不火,但ChatGPT的诞生后,大模型的训练和推理对算力的巨大需求,让拥有数万张显卡的CoreWeave迅速崛起,客户和风投纷至沓来。

然而,令人费解的是,CoreWeave累计融资仅5.8亿美元,账面GPU净值不超过10亿美元,公司整体估值也只有20亿美元,却仍能通过抵押获得23亿美元的贷款。华尔街一向精于算计,为何如此慷慨?原因很可能在于CoreWeave虽然账面尚未拥有这么多显卡,但已获得英伟达的供货承诺,尤其是H100。CoreWeave与英伟达的紧密关系在硅谷已是公开的秘密。这种关系的根基源于CoreWeave对英伟达的绝对忠诚和支持——坚持使用英伟达的显卡,坚决不自主研发芯片,在显卡市场低迷时帮助英伟达囤积库存。对黄仁勋而言,这种关系的价值远超与微软、谷歌和特斯拉的普通合作关系。因此,尽管H100显卡供应紧张,英伟达仍将大量新卡分配给CoreWeave,甚至不惜限制对亚马逊和谷歌等大厂的供应。黄仁勋在电话会议中高度评价:“一批新的GPU云服务提供商会崛起,其中最著名的是CoreWeave,他们做得非常好。”

在获得23亿美元融资的前一周,CoreWeave对外宣布,将耗资16亿美元在德州建设一个占地42,000平方米的数据中心。凭借与英伟达的关系和优先配货权,CoreWeave成功从银行获得建设资金——这种模式让人联想到房地产开发商拿地后立即贷款的模式。因此,可以说,一份H100的供货承诺,堪比房地产黄金时代的土地批文。

H100显卡的稀缺性在今年4月接受采访时得到马斯克的抱怨:“现在似乎连狗都在买GPU。”讽刺的是,特斯拉早在2021年就发布了自研的D1芯片,由台积电代工,采用7nm工艺,号称能替代当时英伟达主流的A100。然而两年过去,英伟达推出了更强大的H100,而特斯拉的D1没有后续迭代,因此当马斯克试图组建自家人工智能公司时,仍不得不向黄仁勋低头求购显卡。

H100显卡于去年9月20日正式推出,由台积电4N工艺代工。相较于前代A100,H100单卡在推理速度上提升3.5倍,训练速度提升2.3倍;若采用服务器集群运算,训练速度更是能提高9倍,原本一周的工作量现在只需20小时。相比A100,H100单卡价格更高,约是A100的1.5至2倍,但训练大模型的效率提升了200%,因此“单美元性能”更高。若搭配英伟达最新的高速连接系统方案,每美元的GPU性能可能提升4至5倍,因而备受客户追捧。

抢购H100显卡的客户主要分为三类:第一类是综合型云计算巨头,如微软Azure、谷歌GCP和亚马逊AWS等。这些公司财力雄厚,常试图“包圆”英伟达的产能,但同时也对英伟达的垄断地位不满,暗中研发芯片以降低成本。第二类是独立的云GPU服务商,如CoreWeave、Lambda和RunPod等。这类公司算力规模相对较小,但能提供差异化服务,英伟达也大力扶持他们,甚至直接投资了CoreWeave和Lambda,目的明确:给那些私自造芯的巨头们上眼药。第三类是自建LLM(大语言模型)的大小公司,既有Anthropic、Inflection、Midjourney等初创企业,也有苹果、特斯拉、Meta等科技巨头。它们通常一边使用外部云服务商的算力,一边采购GPU自建数据中心——有钱的多买,没钱的少买,各取所需。

在这三类客户中,微软Azure至少拥有5万张H100,谷歌云手上有约3万张,Oracle大约有2万张,特斯拉和亚马逊也至少有1万张,CoreWeave据称有3.5万张的额度承诺(实际到货约1万张)。其他公司很少超过1万张。这三类客户总共需要多少张H100呢?根据海外机构GPU Utils的预测,当前H100需求约43.2万张。其中OpenAI需要5万张训练GPT-5,Inflection需要2.2万张,Meta需要2.5万张(也有说法是10万张),四大公有云厂商每家至少需要3万张,私有云行业需要10万张,其他小模型厂商也有10万张需求。

英伟达2023年的H100出货量约50万张,目前台积电的产能仍在爬坡,到年底H100显卡的供应紧张状况将得到缓解。但长期来看,随着AIGC应用的爆发,H100的供需缺口将持续扩大。根据金融时报的报道,2024年H100的出货量将高达150万至200万张,较今年的50万张提升3至4倍。而华尔街的预测更为激进:美国投行Piper Sandler认为,明年英伟达在数据中心上的营收将超过600亿美元(FY24Q2:103.2亿美元),按此数据推算,A+H卡的出货量接近300万张。还有更夸张的估计。某H100服务器最大代工厂(市占率70%-80%),从今年6月开始陆续出货H100服务器,7月份产能逐步提升。一份最新调研显示,该代工厂认为2024年A+H卡的出货量将在450万至500万张之间。这对英伟达而言意味着“泼天的富贵”,因为H100的暴利程度远超其他行业。

为了揭示H100的暴利程度,不妨将其物料成本(BOM)彻底拆解。如图所示,H100最通用的版本H100 SXM采用台积电CoWoS的7晶粒封装,6颗16G的HBM3芯片分列两排紧紧围绕着中间的逻辑芯片。这也构成了H100的三大核心部分:逻辑芯片、HBM存储芯片、CoWoS封装,除此之外,还有PCB板及其他辅助器件,但价值量不高。

H100拆机图显示,核心逻辑芯片尺寸为814mm²,产自台积电最先进的台南18号工厂,采用“4N”工艺,实际为5nm+。由于5nm下游手机等领域的景气度不佳,台积电在保供逻辑芯片上毫无压力。这块逻辑芯片由12寸(面积70,695mm²)的晶圆切割产生,理想状态下可切出86块,但考虑到“4N”工艺80%的良率及切割损耗,最终一张12寸晶圆只能切出65块核心逻辑芯片。这块核心逻辑芯片的成本是多少?台积电2023年一片12寸晶圆对外报价为13,400美元,折算下来单块约200美元。接下来是6颗HBM3芯片,目前由SK海力士独家供应,这家起源于现代电子的企业,2002年几乎要委身于美光,依靠政府输血及逆周期产能战略,如今在HBM量产技术上至少领先美光3年(美光卡在HBM2e,海力士2020年中期量产)。HBM的具体价格各家讳莫如深,但据韩媒说法,HBM目前是现有DRAM产品的5至6倍。而现有GDDR6 VRAM的价格约为每GB3美元,如此推算HBM的价格约为每GB15美元。因此,一张H100 SXM在HBM上的花费约为1500美元。尽管今年HBM价格不断上涨,英伟达、Meta高管也亲赴海力士“督工”,但下半年三星的HBM3将逐步量产出货,加上韩国双雄的扩张血脉,预计明年HBM将不再是瓶颈。而真正瓶颈的是台积电的CoWoS封装,这是一种2.5D封装工艺。相比直接在芯片上打孔(TSV)、布线(RDL)的3D封装,CoWoS在成本、散热及吞吐带宽上更具优势,对应HBM的成本和散热,以及GPU的关键吞吐带宽。因此,高存力、高算力的芯片离不开CoWoS封装。英伟达、AMD四款GPU均采用CoWoS,是最好的佐证。CoWoS的成本是多少?台积电22年财报显示,CoWoS工艺占总营收7%,海外分析师Robert Castellano根据产能及裸晶尺寸推算,封装一块AI芯片能给台积电带来723美元的营收。因此,上述三大核心成本项合计约2500美元,其中台积电占1000美元(逻辑芯片+CoWoS),SK海力士占1500美元(未来三星可能加入),再算上PCB等材料,整体物料成本不超过3000美元。而H100的售价为35,000美元,毛利率超过90%。过去十年英伟达毛利率约60%上下,今年Q2受高毛利A100/A800/H100拉动,毛利率已站上70%。这反常识:英伟达严重依赖台积电代工,后者地位无人撼动,甚至能卡英伟达脖子。但3.5万美元的卡,制造它的台积电仅拿1000美元(收入而非利润)。不过,用毛利率定义暴利对芯片公司意义不大,从沙子算起,毛利率更高。一张4N工艺的12寸晶圆,台积电对外报价约1.5万美元,英伟达能加个零卖给客户,自然有其诀窍。这个诀窍的秘密在于:英伟达本质上是一个伪装成硬件厂商的软件公司。软硬一体的护城河英伟达最强大的武器,就藏在毛利率减去净利率的部分。在本轮AI热潮前,英伟达毛利率常年65%上下,净利率通常30%。今年Q2受高毛利A100/A800/H100拉动,毛利率站上70%,净利率更是高达45.81%。近3财年英伟达单季度毛利率与净利率英伟达目前全球有超过2万名员工,多为高薪软硬件工程师,根据美国猎聘Glassdoor数据,平均年薪超20万美元。近十年英伟达研发费用率绝对值高速增长,稳态下维持在20%以上。当然,若终端需求爆发,如2017年深度学习、21年挖矿、今年大语言模型,营收分母骤升,研发费用率会短暂跌至20%,利润相应非线性暴增。而在英伟达众多研发项目中,CUDA最为关键。03年Ian Buck团队为解决DirectX编程门槛问题,推出Brook编程模型,即CUDA雏形。06年Buck加入英伟达,说服黄仁勋研发CUDA。因支持C语言并行计算,CUDA迅速成为工程师首选,让GPU走上通用处理器(GPGPU)道路。CUDA成熟后,Buck再次劝说黄仁勋,要求所有GPU必须支持CUDA。06年CUDA立项,07年推出产品,当时英伟达年营收仅30亿美元,却投入5亿美元。到17年,CUDA研发支出已超百亿。曾有私有云公司CEO表示,他们也曾考虑转用AMD显卡,但调试至少需两个月。为缩短时间,英伟达投入百亿走了20年。芯片行业半个世纪,从未有企业像英伟达一样,既卖硬件也卖生态,或如黄仁勋所说:“卖的是准系统”。因此,英伟达对标的是苹果——另一家卖系统的公司。从07年推出CUDA到成为全球印钞厂,英伟达并非没有对手。08年英特尔中断与英伟达合作,推出GPCPU,欲在PC领域“划江而治”。但英伟达通过产品迭代,将处理器推广至太空、金融、生物医疗等领域,10年后英特尔被迫取消独立显卡计划。09年苹果开发团队推出OpenCL,试图在CUDA上分一杯羹。但OpenCL在深度学习生态上远不如CUDA,许多框架要么在CUDA后支持OpenCL,要么根本不支持。深度学习掉队使OpenCL始终无法触及高附加值业务。15年AlphaGo初露锋芒,宣告AI时代来临。此时英特尔为赶上末班车,将AMDGPU装入系统芯片内,这是两家公司自80年代以来的首次合作。如今CPU老大、老二+GPU老二的市值之和仅是GPU老大英伟达的1/4。目前看来,英伟达的护城河几乎牢不可摧。尽管不少大客户暗中研发GPU,但庞大生态和快速迭代让他们无法撼动帝国根基,特斯拉就是明证。英伟达的印钞机生意,在可见未来将持续。唯一让黄仁勋烦恼的,是那个客户众多、需求旺盛却卖不进H100、却咬牙攻坚的地方——全世界只有一个。

最新快讯

2025年11月21日

15:06
2025年11月21日,亚马逊正式公布一项雄心勃勃的投资计划,宣布将在美国密西西比州沃伦县打造一个全新的数据中心园区,专注于支持人工智能和云计算业务的发展。据悉,亚马逊将至少投入30亿美元巨资用于该项目的建设,这一投资不仅将显著提升亚马逊云服务(AWS)的基础设施能力,还将有效满足全球范围内日益激增的AI计算需求。 该项目预计将直接创造至少200个高技术就业...
15:06
2025年11月21日,捷尼赛思在法国隆重举行了一场别开生面的品牌发布会,正式揭开了其首款纯粹跑车的神秘面纱——Magma GT概念车。这款意义非凡的车型,不仅是为了庆祝捷尼赛思成立十周年而精心打造,更被视为品牌进军高性能跑车领域的宣言,预示着未来量产车型的无限可能。 Magma GT概念车采用了极具辨识度的中置后驱布局,这一经典设计理念赋予了车辆卓越的操控...
15:06
美国东部时间11月19日,全球领先的数字媒体和营销解决方案提供商Adobe正式宣布达成一项重大战略收购,拟以约19亿美元现金收购知名营销软件企业Semrush,双方已达成初步协议,预计该笔交易将于2026年上半年正式完成。此次收购不仅标志着Adobe在营销技术领域的重大布局,更将成为其历史上规模第三大的并购交易,同时也是继Figma收购计划受挫后,Adobe...
15:06
2025年11月21日,备受瞩目的微软Xbox全球发布会如期举行,其中一款国产动作游戏《动物朋克》震撼亮相,正式公布了令人期待的最新实机演示视频。这款游戏由曾打造《暗影火炬城》的知名团队钛核工作室倾力打造,不仅完美延续前作的世界观设定,更在技术层面实现了突破,采用引擎内实录技术呈现画面,将实机演示与精心制作的过场动画融为一体,为玩家带来前所未有的沉浸式体验。...
15:06
2025年11月20日,黑芝麻智能在一场备受瞩目的产品发布会上正式宣布与华中电力科技达成战略合作协议。这一重要合作将聚焦于具身智能机器人、智能布控球以及无人机识别三大核心技术领域,通过双方的深度协同,共同探索电力行业智能化转型的创新路径。此次合作不仅标志着黑芝麻智能在电力行业解决方案上的重要突破,更将显著提升电力运维的效率与安全水平,为行业带来革命性的变革。...
15:06
2025年11月21日,领先的在线金融服务商产连通正式宣布成功完成A+轮融资,投资方为中科浙数。作为国内数字化金融领域的创新企业,产连通长期致力于为制造业、农牧业、跨境电商及仓储物流等关键行业提供全方位的数字化金融解决方案,通过科技赋能助力核心企业及其上下游产业链实现高效协同与价值增长。此次融资不仅为产连通注入了强劲的发展动力,更彰显了资本市场对其创新模式与...
15:06
2025年11月20日,美国蓝色起源公司正式公布了一项令人瞩目的航天工程计划——将打造新型超重型运载火箭“新格伦9x4”。这款火箭被视为公司未来深空探索战略的关键支柱,其设计理念是在现有“新格伦7x2”火箭的基础上实现跨越式升级。根据官方公布的技术参数,新火箭将采用更为强大的动力系统,其第一级将搭载9台高性能发动机,而第二级则配备4台专用助推器,这种独特的9...
15:06
2025年11月21日,中国消费者协会正式发布权威消费警示,揭露部分盗版剧APP背后隐藏的严重安全威胁。经调查发现,这些非法应用不仅通过窃取用户隐私数据、植入恶意程序等手段侵害消费者权益,更以免费观影为诱饵,诱导用户下载使用。中消协专家指出,此类APP在非法盗用影视剧资源的同时,还可能利用用户信息进行精准诈骗,导致财产损失等严重后果。针对当前盗版剧APP泛滥...
15:06
2025年11月22日,中国结算将因技术系统维护,全面暂停统一账户平台及身份信息核查系统的对外服务。此次停服范围覆盖全国,将直接影响相关业务的正常办理。根据官方公告,此次维护工作旨在通过升级系统架构,进一步提升平台的运行稳定性与数据安全性。为确保业务连续性,各金融机构及相关用户需提前做好充分准备,合理安排业务流程,避免因系统暂停造成的不便。建议相关单位密切关...
15:06
2025年11月21日,国新控股(上海)有限公司迎来重大工商变更,标志着这家企业迈入新的发展阶段。根据最新披露的信息,田晖正式接任公司法定代表人一职,全面负责企业的战略运营与日常管理。与此同时,公司注册资本实现跨越式增长,从原有的5亿元大幅增至20亿元,增幅高达300%,这一举措不仅显著增强了企业的资本实力,也为未来的业务拓展注入强劲动力。 此次工商变更被视...
15:06
11月20日,黑芝麻智能在上海隆重举行2025年机器人平台产品发布会,正式向业界展示其前沿的机器人技术布局。发布会上,黑芝麻智能与均胜电子签署战略合作协议,双方将聚焦机器人控制器、智能计算平台及行业应用三大领域,实现深度技术协同与资源共享。此次合作标志着黑芝麻智能在机器人产业生态建设上迈出重要一步,为推动行业智能化发展注入强劲动力。 黑芝麻智能在发布会上正式...
14:49
11月21日,在广州车展发布会上,小米正式发布了辅助驾驶系统Xiaomi HAD增强版。该系统通过强化学习与世界模型的融合,实现了更流畅的纵向加减速控制,更果断的横向变道操作,以及更精准的路口选择能力。据悉,该系统将陆续开始向用户推送更新。值得注意的是,多张官方PPT上用醒目的大字标注"辅助驾驶不是自动驾驶,驾驶仍需时刻保持专注",这一明确提醒旨在强调辅助驾...