1849年,美国加州金矿的发现点燃了淘金热潮。无数人从东海岸、欧洲大陆乃至初到美国的华人移民涌入这片新大陆,他们最初称这里为「金山」,后来改称「旧金山」。无论名称如何变迁,淘金者们的生存离不开衣食住行,而最关键的装备则是淘金铲。古人云「工欲善其事,必先利其器」,为了提高淘金效率,人们纷纷涌向卖铲人,带动了财富的流动。一个多世纪后,旧金山以南的硅谷掀起了新的淘金热潮:OpenAI发现了AI时代的「金矿」,而英伟达则成为第一批「卖铲人」。与过去相似,无数人和公司涌入这片热土,拿起新时代的「铲子」开始挖掘。但不同的是,过去的铲子几乎无技术门槛,而如今英伟达的GPU成为所有人的首选。今年以来,仅字节跳动就向英伟达订购了超过10亿美元的GPU,包括10万块A100和H800加速卡。百度、谷歌、特斯拉、亚马逊、微软等大公司今年至少都向英伟达订购了上万块GPU。但这仍无法满足需求。旷视科技CEO印奇3月底接受财新采访时表示,中国仅约4万块A100可用于大模型训练。随着AI热潮持续,英伟达上一代高端GPU A100的阉割版A800在国内一度涨至10万元一块。6月的一场非公开会议上,OpenAICEO Sam Altman再次表示,GPU严重短缺导致ChatGPT优化工作被迫推迟。据技术咨询机构TrendForce测算,OpenAI需要约3万块A100才能持续优化和商业化ChatGPT。自今年1月ChatGPT新一轮爆发以来,AI算力短缺已持续近半年。这些大公司为何仍缺GPU和算力?ChatGPT们缺的不是显卡,而是英伟达的一句广告语:不是所有GPU都是英伟达。GPU短缺实质是英伟达高端GPU的短缺。对AI大模型训练而言,要么选择英伟达A100、H100GPU,要么选择去年禁令后推出的减配版A800、H800。AI使用包括训练和推理两个环节,前者是造模型,后者是使用模型。AI大模型的预训练和微调,尤其是预训练环节需要大量算力,特别看重单卡性能和多卡间数据传输能力。目前能提供大模型预训练计算效率的AI芯片(广义指面向AI的芯片)数量虽不少,但真正高效的非常有限。大模型至少千亿级参数,训练需要巨量算力,多GPU间数据传输和同步会导致部分GPU闲置。因此单个GPU性能越高、数量越少,利用效率越高,成本越低。英伟达2020年发布的A100、H100,既具备单卡高算力,又有高带宽优势。A100FP32算力达19.5TFLOPS,H100更是高达134TFLOPS。NVLink和NVSwitch等技术投入也构筑了深厚护城河。到H100,第四代NVLink支持多达18个链路,总带宽900GB/s,是PCIe5.0的7倍。面向中国市场的A800和H800,算力几乎不变,但带宽分别削减了四分之一和一半,按彭博社说法,同等AI任务H800需比H100多花10%-30%时间。即便如此,A800和H800的计算效率仍超过其他GPU和AI芯片。这也是AI推理市场「百花齐放」而AI训练市场英伟达「一家独大」的原因。软件生态是英伟达核心护城河,其2007推出的CUDA统一计算平台已成为AI基础设施,绝大多数开发者基于CUDA开发,如同Android、iOS之于移动应用。英伟达也明白高端GPU抢手,春节后追加晶圆代工订单,但问题恰恰出在代工环节。英伟达高端GPU离不开台积电,消费电子低潮导致晶圆代工产能普遍下滑,但台积电先进制程例外。ChatGPT引发AI热潮,基于台积电7nm的A100、4nm的H100紧急追加订单,5/4nm产线已近满载。供应链预估英伟达SHR订单将持续1年,台积电产能不足。分析师认为英伟达应考虑三星或英特尔代工,但英伟达短期内无法离开台积电。黄仁勋在COMPUTEX上表示下一代芯片仍交由台积电代工。技术核心原因在于英伟达高端加速卡采用台积电CoWoS先进封装技术解决存算一体问题,而CoWoS核心技术离不开台积电。2012年台积电推出CoWoS技术,实现晶圆代工到终端封装一条龙服务,客户包括英伟达、苹果等。为满足英伟达需求,台积电采用部分委外转包,但不包括CoWoS制程。野村证券预估台积电CoWoS年化产能2022年底约7-8万片,2023年底增至14-15万片,2024年底挑战20万片,但先进CoWoS封装产能严重供不应求,去年起订单翻番,今年谷歌、AMD需求同样强劲。即便是英伟达,也要通过黄仁勋与张忠谋的私人关系争取更高优先级。写在最后过去几年疫情和地缘政治让所有人意识到芯片的重要性。ChatGPT后AI再度举世瞩目,对AI加速算力的渴望带来芯片订单激增。高端GPU设计和制造需要长期研发投入,面临难以逾越的硬件和软件壁垒,导致英伟达和台积电在这场「算力盛宴」中占据主导地位。中国公司在AI软件能力上追赶迅速,但在AI加速底层硬件上却鲜有投入。目前最重要的四款GPU已有两款受限,阉割的A800、H800不仅拖慢中国公司追赶速度,也存在受限风险。比起大模型角逐,中国公司更需要关注底层硬件竞争。
最新快讯
2026年02月09日
大模型时代,AI 是帮学生“写作业”还是“教学习”?前谷歌高管皮尤什·兰詹(Piyush Ranjan)显然选择了后者。近期,他正式推出了 AI 教育平台 Fermi.ai,旨在彻底改变中学生学习 STEM(科学、技术、工程、数学)学科的逻辑。拒绝快速答案,主攻“深度学习”。与那些直接给出解题步骤的 AI 助手不同,Fermi.ai 的核心理念是利用 AI ...
作为国内最火的种草平台,小红书显然不满足于只做内容的“搬运工”,而是要直接下场帮博主们“卷”生产力了。 2 月 9 日消息,小红书技术团队正在秘密研发一款名为 OpenStoryline 的视频剪辑类 AI 产品,目前版本号已迭代至 1.0.0。这款产品的核心杀手锏是“对话式剪辑”。不同于传统剪辑软件密密麻麻的时间轴和复杂的滤镜参数,OpenStorylin...
据知情人士透露,AI 硬件领军企业 Plaud 正与智能终端巨头 荣耀 (Honor) 展开深度合作,为其开发 OS 系统级原生 AI 录音功能。与以往第三方插件不同,此次合作旨在将 AI 会议纪要能力直接嵌入手机原生应用中。据悉,Plaud 将主要提供软件层面的技术支持。未来,荣耀用户无需额外购买硬件或下载第三方应用,只需通过升级 Magic OS 版本,...
OpenAI 首席执行官 Sam Altman 再次展现了他作为科技投资风向标的惊人手笔。近日,这位 AI 界的领军人物被曝已向名为“世界实验室”(World Labs)的 AI 创业公司投入重金。这家由斯坦福大学教授、前谷歌云 AI 总负责人李飞飞(Fei-Fei Li)创办的初创公司,在极短时间内便筹集了超过 1 亿美元的资金,公司估值更是飙升至 10 ...
微新创想:近日,知名自托管人工智能代理框架 OpenClaw(前身为 Clawdbot)遭遇严重的供应链攻击。网络安全平台 VirusTotal 在最新博文中披露,该框架的扩展平台 ClawHub 被植入了大量伪装成实用工具的恶意软件。
攻击细节显示,木马伪装成“合法技能”调查显示,攻击者利用 OpenClaw 可执行 shell 命令、操作文件及发起网络请...
微新创想:全球科技行业正陷入一场前所未有的“烧钱大战”。据AIbase报道,最新的行业数据显示,以亚马逊、谷歌、Meta和微软为首的科技巨头们正以前所未有的速度向人工智能基础设施砸钱。预计到2026年,这四大巨头的年度资本支出总额将冲向6600亿美元(约合人民币4.7万亿元)的历史巅峰。这场狂热的支出潮主要集中在建设庞大的数据中心、购买高性能芯片以及研发定制...
微新创想:在科技与娱乐圈跨界碰撞的现场,有时也会演变成令人捧腹的“事故”。知名说唱歌手 Cardi B 近日在旧金山与一台尺寸精巧的人形机器人进行互动时,发生了一段意外的小插曲。当时,Cardi B 兴致颇高,对着这台拥有银色金属外壳的小型机器人大秀舞技,不仅伸手抚摸其机身,还进行了一段充满挑逗意味的互动。
当她试图亲昵地搂住机器人的脖子时,似乎低估了这台精...
微新创想:中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2 在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式 彻底颠覆了传统视觉模型平铺直叙的处理逻辑。DeepSeek 研究人员指出 人类眼睛在观察物体时会根据内容进行灵活聚焦。为了实现这一特性 DeepSeek OCR2 引入了全新的架...
微新创想:2026年2月,南京屹立芯创半导体科技有限公司宣布完成A+轮融资,由承辰创投、电控产投联合投资。此次融资标志着公司在半导体领域的发展迈出了重要一步。
该公司专注于半导体器件专用设备的研发与制造,致力于为行业提供高性能、高可靠性的解决方案。凭借先进的技术实力和完善的产业链布局,屹立芯创在半导体装备市场中逐渐崭露头角。
本轮融资将用于加速关键设备的量产...
微新创想:2026年2月9日,易生支付在北京总部宣布,近日先后荣获猎聘颁发的2025“非凡雇主”与智联招聘2025“优选雇主”称号。此次评选覆盖全国数千家企业,依据雇主品牌建设、员工关怀、组织文化及人才发展等维度综合评定。易生支付因在薪酬福利体系优化、数字化培训机制及多元化职场环境建设方面的突出表现获此双项认可。公司表示将持续强化人才战略,支撑支付科技业务高...
微新创想:2026年2月7日,美国公司Analogue宣布推出限量版Analogue 3D原型主机。这款主机采用FPGA技术,成功复刻了任天堂N64经典游戏机,不仅能够运行原版游戏,还兼容N64的原始卡带与配件。Analogue 3D的推出,让众多怀旧玩家有机会再次体验N64时代的经典游戏。
微新创想:此次发布的Analogue 3D特别之处在于其复刻的五种...
微新创想:2026年2月,美国SaaS企业Turnstile宣布完成2900万美元融资。本轮融资由First Round领投,OMERS Ventures与Illuminate Financial跟投。Turnstile是一家专注B2B SaaS领域的一体化收入管理平台研发商,主打AI-first报价到回款(quote-to-cash)解决方案。该方案旨在替...
