1849年,美国加州金矿的发现点燃了淘金热潮。无数人从东海岸、欧洲大陆乃至初到美国的华人移民涌入这片新大陆,他们最初称这里为「金山」,后来改称「旧金山」。无论名称如何变迁,淘金者们的生存离不开衣食住行,而最关键的装备则是淘金铲。古人云「工欲善其事,必先利其器」,为了提高淘金效率,人们纷纷涌向卖铲人,带动了财富的流动。一个多世纪后,旧金山以南的硅谷掀起了新的淘金热潮:OpenAI发现了AI时代的「金矿」,而英伟达则成为第一批「卖铲人」。与过去相似,无数人和公司涌入这片热土,拿起新时代的「铲子」开始挖掘。但不同的是,过去的铲子几乎无技术门槛,而如今英伟达的GPU成为所有人的首选。今年以来,仅字节跳动就向英伟达订购了超过10亿美元的GPU,包括10万块A100和H800加速卡。百度、谷歌、特斯拉、亚马逊、微软等大公司今年至少都向英伟达订购了上万块GPU。但这仍无法满足需求。旷视科技CEO印奇3月底接受财新采访时表示,中国仅约4万块A100可用于大模型训练。随着AI热潮持续,英伟达上一代高端GPU A100的阉割版A800在国内一度涨至10万元一块。6月的一场非公开会议上,OpenAICEO Sam Altman再次表示,GPU严重短缺导致ChatGPT优化工作被迫推迟。据技术咨询机构TrendForce测算,OpenAI需要约3万块A100才能持续优化和商业化ChatGPT。自今年1月ChatGPT新一轮爆发以来,AI算力短缺已持续近半年。这些大公司为何仍缺GPU和算力?ChatGPT们缺的不是显卡,而是英伟达的一句广告语:不是所有GPU都是英伟达。GPU短缺实质是英伟达高端GPU的短缺。对AI大模型训练而言,要么选择英伟达A100、H100GPU,要么选择去年禁令后推出的减配版A800、H800。AI使用包括训练和推理两个环节,前者是造模型,后者是使用模型。AI大模型的预训练和微调,尤其是预训练环节需要大量算力,特别看重单卡性能和多卡间数据传输能力。目前能提供大模型预训练计算效率的AI芯片(广义指面向AI的芯片)数量虽不少,但真正高效的非常有限。大模型至少千亿级参数,训练需要巨量算力,多GPU间数据传输和同步会导致部分GPU闲置。因此单个GPU性能越高、数量越少,利用效率越高,成本越低。英伟达2020年发布的A100、H100,既具备单卡高算力,又有高带宽优势。A100FP32算力达19.5TFLOPS,H100更是高达134TFLOPS。NVLink和NVSwitch等技术投入也构筑了深厚护城河。到H100,第四代NVLink支持多达18个链路,总带宽900GB/s,是PCIe5.0的7倍。面向中国市场的A800和H800,算力几乎不变,但带宽分别削减了四分之一和一半,按彭博社说法,同等AI任务H800需比H100多花10%-30%时间。即便如此,A800和H800的计算效率仍超过其他GPU和AI芯片。这也是AI推理市场「百花齐放」而AI训练市场英伟达「一家独大」的原因。软件生态是英伟达核心护城河,其2007推出的CUDA统一计算平台已成为AI基础设施,绝大多数开发者基于CUDA开发,如同Android、iOS之于移动应用。英伟达也明白高端GPU抢手,春节后追加晶圆代工订单,但问题恰恰出在代工环节。英伟达高端GPU离不开台积电,消费电子低潮导致晶圆代工产能普遍下滑,但台积电先进制程例外。ChatGPT引发AI热潮,基于台积电7nm的A100、4nm的H100紧急追加订单,5/4nm产线已近满载。供应链预估英伟达SHR订单将持续1年,台积电产能不足。分析师认为英伟达应考虑三星或英特尔代工,但英伟达短期内无法离开台积电。黄仁勋在COMPUTEX上表示下一代芯片仍交由台积电代工。技术核心原因在于英伟达高端加速卡采用台积电CoWoS先进封装技术解决存算一体问题,而CoWoS核心技术离不开台积电。2012年台积电推出CoWoS技术,实现晶圆代工到终端封装一条龙服务,客户包括英伟达、苹果等。为满足英伟达需求,台积电采用部分委外转包,但不包括CoWoS制程。野村证券预估台积电CoWoS年化产能2022年底约7-8万片,2023年底增至14-15万片,2024年底挑战20万片,但先进CoWoS封装产能严重供不应求,去年起订单翻番,今年谷歌、AMD需求同样强劲。即便是英伟达,也要通过黄仁勋与张忠谋的私人关系争取更高优先级。写在最后过去几年疫情和地缘政治让所有人意识到芯片的重要性。ChatGPT后AI再度举世瞩目,对AI加速算力的渴望带来芯片订单激增。高端GPU设计和制造需要长期研发投入,面临难以逾越的硬件和软件壁垒,导致英伟达和台积电在这场「算力盛宴」中占据主导地位。中国公司在AI软件能力上追赶迅速,但在AI加速底层硬件上却鲜有投入。目前最重要的四款GPU已有两款受限,阉割的A800、H800不仅拖慢中国公司追赶速度,也存在受限风险。比起大模型角逐,中国公司更需要关注底层硬件竞争。

最新快讯

2026年02月09日

09:38
微新创想 苹果2026年秋季将率先推出三款顶级旗舰机型 这其中包括常规迭代的iPhone 18 Pro 以及iPhone 18 Pro Max 还有外界期待已久的折叠屏iPhone 而定位更贴近大众市场的iPhone 18与iPhone 18e 则预计会推迟到2027年春季才正式登场 iPhone 18 Pro Max作为苹果历史上最强悍的直板旗舰 在影...
09:32
微新创想:作为人工智能浪潮的领航者,英伟达(NVIDIA)正通过自身的技术闭环实现生产力的指数级跃迁。据AIbase报道,英伟达已正式在公司内部为多达3万名工程师大规模部署了生成式人工智能编码工具。这一动作意味着,这家芯片巨头不仅在为全球提供AI算力,自身也已深度进入“AI辅助设计”的新阶段。 此次英伟达选择与旧金山的初创公司Anysphere Inc.深度...
09:32
微新创想:OpenAI在软件领域势如破竹后,其硬件版图的轮廓也终于清晰。据最新爆料显示,其备受期待的首款AI硬件设备被命名为“Dime”(意为10美分),产品形态并非此前传闻中的智能手机,而是一款类似于苹果AirPods的AI智能耳机。 战略由繁入简:优先布局音频穿戴市场。据悉,OpenAI此前曾考虑过更具革命性的“类手机”架构方案,旨在打造一款拥有独立算力...
09:32
微新创想:系统性能优化领域的顶尖大牛、被技术圈尊称为“性能之神”的Brendan Gregg正式宣布加入OpenAI。这位曾写出行业教科书《性能之巅》的技术宗师,入职后将直接加入ChatGPT性能团队,通过在澳大利亚远程办公的方式,助力OpenAI攻克大模型背后的算力瓶颈。Gregg的到来在AI界引发了不小的轰动,OpenAI总裁Brockman更是难掩激动...
09:32
微新创想:在科技与宏观经济的交汇点上,特斯拉首席执行官埃隆·马斯克再次抛出了震动业内的言论。据AIbase报道,马斯克在近日的一档播客节目中直言不讳地警告,面对日益沉重的国债压力,如果美国不全力投入AI和机器人技术的开发,国家将面临“1000%破产”的极端困境。 马斯克在对话中列出了一组触目惊心的数字:目前美国国债规模已高达38.5万亿美元,每年的利息支出就...
09:32
微新创想:OpenRouter平台近日悄然上线了一个代号为“Pony Alpha”的隐秘模型 其强大性能和免费属性让业界震惊 本文将基于最新信息 剖析这款模型的亮点与谜团 模型性能惊人 免费开放引热议 这款“Pony Alpha”模型被描述为下一代基础模型 在编码 推理 角色扮演以及代理工作流等方面表现出色 它支持高达200K的上下文窗口和131K的最大输出...
09:32
微新创想:字节跳动近日正式发布了其最新的 AI 视频生成模型 Seedance2.0(集成于即梦 Dreamina 平台)这一重磅更新被业内视为 AI 视频创作的分水岭标志着视频制作门槛的彻底消失“一个人就是一个剧组”已从愿景变为现实 核心功能突破一键剧本转短剧用户仅需导入短剧剧本及一张参考图Seedance2.0即可生成逻辑连贯的动态画面实测显示其剧情理解...
09:32
微新创想:据 AIbase 报道,Anthropic 近日为其旗舰模型 Claude Opus 推出了全新的“快速模式”(Fast Mode)。这一模式的推出标志着 Anthropic 在提升模型响应速度方面迈出了重要一步。快速模式的核心目标是通过牺牲部分经济性,换取极致的响应效率,从而满足用户对实时性与速度的更高需求。与标准模式相比,快速模式的响应速度提升...
09:32
微新创想:近日全球互联网域名市场传来重磅消息象征人工智能缩写的顶级域名AI.com以7000万美元的高价易主这一交易创下了目前公开报道中最贵域名的纪录买家是加密货币交易平台加密货币网的联合创始人兼首席执行官Kris Marszalek Marszalek 表示他认为人工智能将成为未来几十年最伟大的技术潮流因此这笔投资具有极大的潜力该域名将在本周正式推出一项名...
09:07
微新创想:2月6日至7日,广州正佳广场举办的“大唐千灯会嘉年华”活动现场,一段正佳集团副董事长兼CEO谢萌身着唐装、以“岭南荔枝使”身份登台表演的魔性舞蹈视频迅速火遍全网。视频中,谢萌从舞台弹射而出,扭腰甩手、动作夸张大开大合,宛如一场“古装维密秀”,彩排时甚至模仿起“开屏红孔雀”的姿态,其独特舞风引发网友热烈讨论。 活动现场,台下员工的反应同样成为焦点。他...
09:07
微新创想:苹果即将推出新一代iPhone 17e 机型 该机型将取代iPhone 16e 成为目前苹果最便宜的新手机 价格预计保持不变 国行版本为4499元 在国家补贴后仅需3999元 iPhone 17e 相比前代产品有四大主要升级点 首当其冲的是芯片的更新 该机型将搭载与iPhone 17同款的A19芯片 虽然预计相比标准版会少一颗GPU核心 但日常使用...
09:07
微新创想:近日南京市第二医院收治了一名30多岁的男性患者,该患者在服用药物甲硝唑后饮酒,引发了严重的不良反应,一度生命垂危。患者被送入医院时已经神志不清,浑身散发酒气,经过详细检查后被确诊为急性肝衰竭。 该男子在入院三到四天后病情进一步恶化,出现了肝性脑病的症状,甚至连自己的父母都无法辨认。医疗团队立即采取了紧急救治措施,持续全力抢救了五天,最终患者才成功脱...