在人工智能(AI)领域,GPU扮演着至关重要的角色,其核心应用场景主要分为两大类:训练场景和推理场景。训练场景指的是利用GPU加速AI算法的训练过程,而推理场景则是指通过GPU加速AI算法的推理运算。目前,中国高端AI场景中的GPU应用几乎完全由英伟达的A800芯片所覆盖。A800被普遍视为A100的降级版,由于去年美国政府加强了对华出口管制,英伟达迅速推出了数据传输速度相对较慢的A800,用以替代A100向中国出口,类似情况还发生在更高端的H100和H800芯片上。由于中国暂时缺乏用于云端AI训练的高性能GPU,A800因此获得了中国互联网巨头的广泛青睐。

全球芯片巨头纷纷囤积GPU,以应对日益增长的AI需求。据报道,百度、腾讯、阿里巴巴和字节跳动等中国互联网巨头今年向英伟达下达的交付订单总额高达10亿美元,总共采购约10万张A800芯片;明年交付的AI芯片价值更是预计将达到40亿美元。这充分显示出中国大型科技公司对GPU采购的迫切需求。不仅国内企业如此,国外大客户对英伟达的A100/H100芯片需求同样十分旺盛。近期一张广为流传的“我们需要多少张GPU”的图表引发了广泛关注,其中数据显示:GPT-4可能需要10000至25000张A100进行训练;Meta大约需要21000张A100;Tesla则需要约7000张A100;Stability AI大约需要5000张A100;Falcon-40B在384张A100上完成训练;Inflection则使用了3500张H100来训练与GPT-3.5能力相当的模型。此外,根据马斯克的说法,GPT-5可能需要30000至50000张H100。

面对如此巨大的需求,英伟达的GPU供应陷入极度短缺。据外媒报道,在生成式人工智能需求激增和国际形势变化等多重因素影响下,英伟达专供中国市场的A800和H800 GPU价格持续上涨。7月中旬,英伟达代理商反馈,A800 GPU单价已涨至12万元,H800和H100的报价也都超过20万元。目前英伟达的订单能见度已延伸至2024年,按照当前的排产进度,即使是A800/H800也需到今年年底或明年才能交付。

产量瓶颈究竟在哪里?据tomshardware报道,英伟达DGX系统副总裁兼总经理Charlie Boyle公开澄清了公司GPU产量问题的具体原因。Charlie Boyle表示,问题并非源于英伟达对需求预测的失误,或其制造合作伙伴台积电的晶圆产量问题。相反,制造足够数量的GPU以满足消费者和专业工作负载(尤其是AI)的瓶颈,主要在于后续的芯片封装步骤。英伟达的H系列GPU采用台积电的2.5D CoWoS封装技术,这种多步骤、高精度的工程流程复杂性较高,导致在给定时间内可以组装的GPU数量受限,从而影响了整体供应。马斯克也曾表示“GPU超级难得”。因此,当人们提及“GPU短缺”时,实际上是指主板上某些组件的短缺或积压,而非GPU本身。

在芯片成为可用GPU之前,需要经过从芯片设计到制造的多个环节。芯片设计阶段的问题可能因设计疏忽导致制造瓶颈,从而降低设计的良率。稀土金属或其他材料(如近期受限的镓)的短缺会影响长物流链中的其他环节;材料污染、能源中断等多种因素也会造成影响。但CoWoS封装的瓶颈问题可能比预想的更为严重。台积电也表示,预计需要一年半(并完成额外晶圆厂和现有设施的扩建)才能使封装订单积压恢复正常。这可能意味着英伟达不得不决定将哪些封装能力分配给哪些产品,因为其没有足够的时间和资源来封装所有产品。

不仅如此,为限制中国AI产业的发展,美国总统拜登在今年8月正式签署行政命令,限制美国企业未来在半导体、量子计算和人工智能三大敏感技术领域的对华投资。预计该命令将于明年实施。产量不足尚可克服,但若供应被切断,极有可能使这些正在进行云端AI训练的大厂陷入困境,这也正是这些科技巨头竞相囤积A800芯片的原因。

仍需关注的是,倘若A800/H800真的受到美国禁令的影响,中国本土芯片公司以及那些正在自研芯片的科技大厂是否有能力担此重任?运行大模型,国产GPGPU有哪些可选标的?如今,美国实施新的许可要求,限制中国利用高端GPU获取先进计算能力,由于被限制的是近两年商用领域最先进的GPU产品,暂时没有可以全面替代的选择。美国政府认为,通过切断中国从美国公司获取这些芯片的直接渠道,可以为中国人工智能的发展制造障碍,迟滞中国AI的发展,希望中国AI领域因此一蹶不振。然而事实是,禁令一出,美国企业的股票遇冷下行,而生产类似芯片的中国企业的股票却呈现相反的上行态势,这意味着作为美国企业战略竞争者的中国企业或许能获得更大的发展空间。

其实从2019年开始,应用于超算领域的高端GPU对中国出口就受到严格管制,当时仅限于AMD产品,英伟达的产品并未受影响,因此企业和消费者在产品端的感知并不强烈。而这一次范围扩大后,其主要应用场景除了超算中心外,还包括云计算服务器、数据中心、AI训练等,许多互联网大厂因此受到影响。正因为有了前车之鉴,随着国内云计算及互联网企业在云端存储、数据处理等方面所需数据量的不断增加,各大互联网公司、云厂商也在AI芯片领域积极布局。

2019年,阿里推出人工智能芯片“含光800”,这是一款面向数据中心AI应用的人工处理推理芯片,采用台积电12nm制程,专为AI场景深度定制,进一步提升了AI场景的计算效率。阿里曾表示,“含光800”是当时全球最强的AI芯片,性能和能效比均为第一,1颗“含光800”的算力相当于10颗GPU。目前已应用在阿里云的云服务器中,能够优化电商智能搜索、智能营销等场景。虽然“含光800”不对外销售,但阿里云智能总裁张建峰也提到,“含光800”将通过阿里云对外输出AI算力,未来企业可通过阿里云获取“含光800”的算力。百度也在2020年量产了第一代AI芯片——昆仑。百度昆仑1采用三星14nm制程工艺,目前量产超过2万片,在百度搜索引擎和百度智能云生态伙伴等场景广泛部署。百度昆仑2于2021年下半年实现量产,采用7nm先进工艺,其性能比百度昆仑1提升3倍。据悉,百度正在研发第三款昆仑芯片,计划于明年年初上市。稍慢一些的腾讯也在2021年发布了视频处理芯片“沧海”和AI芯片“紫霄”。字节在“2022 火山引擎原动力大会”上也正式确认了其在自主造芯方面的布局。目前,字节的自研芯片已涉足视频平台、信息和娱乐应用等领域。到目前为止,国内互联网大厂的芯片研发方向都集中在云计算、视频图像处理等领域的专用或通用芯片上。

除了互联网大厂,国内GPU厂商也持续推出性能优异的产品。目前全球AI计算芯片主要分为GPGPU、ASIC、FPGA三种架构。被限制的A800和H800芯片属于GPGPU架构。当前国内AI芯片主要厂商包括华为、寒武纪、海光信息、遂原、壁仞科技、天数智芯等,此外龙芯也在积极布局。其中,发力GPGPU芯片的包括海光、壁仞科技、沐曦科技、龙芯等。海光的深算一号采用的就是GPGPU架构,是公司DCU系列的主要在售产品。在国内厂商中,海光信息在技术实际量产方面处于第一梯队,其深算一号可运行大模型,在2022年度实现了在大数据处理、人工智能、商业计算等领域的商业化应用。不过,其整体性能仅相当于英伟达P100的水平,约等于英伟达2014年的技术水平。不过,海光的深算二号、三号也处于研发阶段,海光称其产品性能在国内处于领先地位。壁仞科技在2022年发布了首款GPGPU芯片BR100系列,性能方面超越英伟达A100。BR100系列通用GPU芯片支持云端训练和推理,目前已接近流片阶段。壁仞科技的第二款芯片也已经开始架构设计,未来还将逐步推出面向智算中心、云游戏、边缘计算的GPU芯片。至于未来量产应用情况尚不明确。还需重视的是,对于国内初创GPGPU公司而言,软件生态更为关键。目前国内初创公司在细分领域已有一定落地,但在大模型训练上的实际应用还非常有限。倘若未来BR100的实际应用效果良好,那么在软件生态上还需进一步加强。沐曦也是国内GPGPU的重要参与者之一。沐曦公司旗下主要有曦思和曦云两款AI芯片,其中曦云MXC系列是该公司研发的用于AI训练及通用计算的GPU芯片。MXC500是沐曦对标A100/A800的算力芯片,FP32浮点性能可达15TFlops,作为对比,A100显卡FP32性能为19.5 TFLOPS。除了性能接近外,MXC500的完整软件栈(MXMACA)还兼容CUDA,预计年底规模出货。龙芯目前暂无产品发布,目前进展为完成相关IP设计,正在验证优化过程中,第一个集成自研GPGPU核的SOC芯片计划于2024年Q1流片。从流片到量产,若按最快6—12个月的周期计算,龙芯的GPGPU产品至少也要在2024年Q3以后才能发布,量产预计需等到2025年。另外,华为昇腾也备受关注。华为的昇腾910也能用作训练芯片,其算力强劲,超英伟达Tesla V100一倍。但由于昇腾910依赖华为自身软件生态,需要华为深度优化及代码移植,通用性相对较差,且其采用台积电的7nm制程,在制造上同样受到限制,因此暂不深入讨论。

英伟达虽是目前最优选,但不能视为唯一选择。如今GPU缺口仍在扩大,倘若A800/H800也受到供应限制,中国的云服务器厂商必须提前规划自主发展路径。中国AI芯片厂商正从原先强调算力和独特技术的方向,逐渐转向针对特定应用场景的优化。虽然微软、谷歌和百度目前将AI用于聊天绘画,但这并不意味着他们的AI不能做其他事情。当下让AI落地民用市场,不仅能让厂商利用AI获得更多收入(特别是微软、谷歌和百度都有庞大的广告业务),还能让用户更直观地体验AI,在民用市场采集更多数据以反哺云端场景的应用。这个过程可能较长、较慢,但这是必须做的事情。同样,倘若无法与中国进行贸易,美国企业也要承受巨大损失。A800和H800这些GPU就是英伟达为绕过美国对中国实施的出口禁令而开发的,以此维持其在中国市场的地位。英伟达此前透露,下半年将能供应更多GPU,但未提供具体数量信息。英伟达首席财务官Colette Kress在2023年2月至4月的财报电话会议上表示:“我们正在处理本季度的供应,但我们也为下半年采购了大量生产材料。我们相信下半年的供应量将大大高于上半年。”对于中国的市场现状而言,英伟达GPU确实是最优选,但长远来看,不能将其视为唯一选择。

最新快讯

2025年06月28日

12:28
远方好物凭借其领先的平台技术实力与强大的供应链体系,巧妙地将自身优势与微信生态深度融合,成功打造了一个独具特色的健康安全食品销售平台。通过精准整合各地域的特色健康食品资源,远方好物利用微信社交平台的强大传播力,构建起一个高效的信息传递网络。目前,平台已拥有20万核心会员与300万忠实消费者,他们不仅是产品的购买者,更是品牌理念的传播者与口碑的缔造者。 作为一...

2025年06月16日

18:13
由AI驱动开发的创新在线工具——鼓狮工具箱,为用户提供全方位智能解决方案。该平台集合了多种实用功能,涵盖日常办公、学习研究及生活管理等多个领域,通过先进的人工智能技术实现高效便捷的操作体验 核心功能模块包括: 简繁转换工具:https://tools.gushiio.com/jianfan 支持快速准确的中英文简繁体互转,特别适合需要跨语言交流的用户 汉字转...

2025年06月15日

11:16
由AI驱动开发的创新在线工具——鼓狮工具箱,为用户提供全方位智能解决方案。该平台集合了多种实用功能,涵盖日常办公、学习研究及生活管理等多个领域,通过先进的人工智能技术实现高效便捷的操作体验 核心功能模块包括: 简繁转换工具:https://tools.gushiio.com/jianfan 支持简体中文与繁体中文之间无缝切换,适用于各类文档处理与内容创作场景...

2023年11月01日

08:09
10月30日,备受瞩目的"2023新一代人工智能(深圳)创业大赛"在深圳市宝安区隆重拉开帷幕。这场由深圳市互联网信息办公室、宝安区人民政府联合主办,网易传媒鼎力支持的行业盛会,标志着深圳在人工智能领域的发展迈入全新阶段。 深圳市委宣传部副部长、市委网信办主任、市委互联网企业工委书记王楚宏在启动仪式上强调,深圳正以战略眼光抢抓人工智能科技革命机遇,致力于推动A...
08:09
歌尔股份控股子公司歌尔光学科技有限公司正式宣布,将以现金支付与股份支付相结合的方式,全资收购其参股企业驭光科技(绍兴)有限公司100%股权。此次交易总金额约7.95亿元人民币,具体分为两部分:一是歌尔光学以自有资金约7.95亿元收购驭光科技62.812%股权,其中包含公司持有的10.526%股权及关联方持有的0.818%股权;二是通过定向增资扩股方式,占目前...
08:09
编者按:本文来自微信公众号 游戏葡萄(ID:youxiputao),作者:修理,微新创想经授权转载。 01 决赛差点掀翻中国,蒙古为什么能成黑马? 10月8日,杭州亚运会正式闭幕了。电子竞技项目首次纳入亚运会正式比赛项目,可谓备受行业内外关注,线下观赛一票难求。尤其是DOTA2决赛中国对阵蒙古,成为本次亚运会热度最高的几场比赛之一。三局比赛每场打得都异常激烈...
08:09
今年8月13日,钉钉总裁叶军向阿里集团内部宣布了一项重大战略调整——钉钉将脱离阿里云的分管体系,正式成为集团旗下独立运营的“N”公司。这一决策标志着钉钉进入全新的发展阶段,作为阿里集团的重要创新业务,将获得更广阔的自主空间和资源支持。事实上,钉钉的成长历程正是阿里巴巴创新战略的生动实践。 2014年1月,钉钉应运而生,其前身可追溯至阿里内部社交软件“来往”。...
08:09
编者按:本文来自微信公众号白鲸出海(ID:baijingapp),作者白鲸小编,经微新创想授权转载。本文将深入探讨一个极具潜力的社交垂类赛道——穆斯林交友,这一领域或许比许多小众领域更小众,却蕴藏着巨大的市场机遇。根据皮尤研究中心的统计数据,全球穆斯林人口已超过18亿,占全球总人口的23%。伊斯兰教法虽鼓励跨宗教婚姻,但限制穆斯林女性与非穆斯林男性结合。尽管...
08:09
编者按:本文源自微信公众号新消费内参(ID:cychuangye),作者乐乐,经微新创想授权转载。曾经引领新中式奶茶潮流的茶颜悦色,近来却频频陷入负面漩涡。短短一两年间,从员工吐槽薪资遭创始人怒怼,到新品名称被指侮辱女性,再到门店“罚站式”排队引发争议,甚至“努力努力白努力”的推文点燃学生和打工人群的怒火……创始人态度、品牌组织、门店运营、营销策略等短板逐一...
08:09
编者按:本文源自微信公众号DoNews(ID:ilovedonews),作者曹双涛,经微新创想授权转载。近日,广汽集团发布公告宣布,董事会已审议通过《关于广汽三菱重组的关联交易公告》,计划对广汽三菱及其汽车销售公司实施股权调整等重组措施。广汽集团将以1元对价受让三菱自动车工业株式会社与三菱商事株式会社持有的广汽三菱30%和20%股权,使广汽三菱成为广汽集团的...
08:09
烘焙行业正面临一场前所未有的涨价风暴,中产消费者纷纷抱怨面包价格居高不下。近期,小红书平台上涌现大量关于烘焙产品高价的讨论,网友晒出北京、上海、长沙、泉州等地多家烘焙品牌的商品价格,其中北京某品牌脏脏包29元、蓝莓巴斯克芝士蛋糕69元;上海某品牌焦糖牛角酥24元、黑松露双重芝士法包88元;长沙某品牌紫苏杏干夏巴塔18元、开心果布雷斯特车轮泡芙38元;泉州某品...
08:09
茶的味道始终如一,而消费者的心态与口味却发生了翻天覆地的变化。不久前,我有幸结识了一位饮料经销商大哥,在探讨食品饮料行业时,我提及了近期哪些品牌走红、哪些新品备受关注。大哥却一针见血地指出,那些在网上大肆宣传的品牌不过是昙花一现的虚火,他所在地区一年的销量加起来也不过二十箱货。他告诉我,真正火热的饮料只有一个——东方树叶,其他品牌都是货找人,唯有东方树叶是人...