大模型浪潮下AI芯片厂商的机遇挑战与国产化趋势

2023-06-24 09:20:15 互联网 65 次阅读

百舸争流，创新者先

编者按：本文源自微信公众号偲睿洞察（ID:siruidongcha），微新创想经授权转载。从2022年11月30日的ChatGPT到2023年6月13日的360智脑大模型2.0，全球AI界已为持续疯狂的大模型热潮燃烧了七个多月。ChatGPT们如雨后春笋般涌现，向AI市场投下一个个“炸弹”：办公、医疗、教育、制造，亟需AI的赋能。AI应用千千万，打造好大模型才是硬道理。对于大模型“世界”来说，算法是“生产关系”，是处理数据信息的规则与方式；算力是“生产力”，能够提高数据处理、算法训练的速度与规模；数据是“生产资料”，高质量的数据是驱动算法持续迭代的养分。在这之中，算力是让大模型转动的前提。众所周知，大模型正对算力提出史无前例的要求，具体的表现是：据英伟达数据显示，在没有以Transformer模型为基础架构的大模型之前，算力需求大致是每两年提升8倍；而自利用Transformer模型后，算力需求大致是每两年提升275倍。基于此，530B参数量的Megatron-Turing NLG模型，将要吞噬超10亿FLOPS的算力。（AI不同模型算法算力迭代情况图源：格隆汇）

大模型的大脑——AI芯片，是支撑ChatGPT们高效生产及应用落地的基本前提。保证算力的高效、充足供应，是目前AI大算力芯片厂商亟需解决的问题。GPT-4等大模型向芯片厂商狮子大开口的同时，也为芯片厂商尤其是初创芯片厂商，带来一个利好消息：软件生态重要性正在下降。早先技术不够成熟之时，研究者们只能从解决某个特定问题起步，参数量低于百万的小模型由此诞生。例如谷歌旗下的AI公司DeepMind，让AlphaGO对上百万种人类专业选手的下棋步骤进行专项“学习”。而小模型多了之后，硬件例如芯片的适配问题迫在眉睫。故，当英伟达推出统一生态CUDA之后，GPU+CUDA迅速博得计算机科学界认可，成为人工智能开发的标准配置。现如今纷纷涌现的大模型具备多模态能力，能够处理文本、图片、编程等问题，也能够覆盖办公、教育、医疗等多个垂直领域。这也就意味着，适应主流生态并非唯一的选择：在大模型对芯片需求量暴涨之时，芯片厂商或许可以只适配1-2个大模型，便能完成以往多个小模型的订单。也就是说，ChatGPT的出现，为初创芯片厂商们提供了弯道超车的机会。这就意味着，AI芯片市场格局将发生巨变：不再是个别厂商的独角戏，而是多个创新者的群戏。本报告将梳理AI芯片行业发展概况、玩家情况，总结出大算力时代，玩家提高算力的路径，并基于此，窥探AI大算力芯片的发展趋势。

国产AI芯片，正走向AI 3.0时代

现阶段的AI芯片，根据技术架构种类来分，主要包括GPGPU、FPGA、以VPU、TPU为代表的ASIC、存算一体芯片。根据其在网络中的位置，AI芯片可以分为云端AI芯片、边缘和终端AI芯片；云端主要部署高算力的AI训练芯片和推理芯片，承担训练和推理任务，例如智能数据分析、模型训练任务等；边缘和终端主要部署推理芯片，承担推理任务，需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。根据其在实践中的目标，可分为训练芯片和推理芯片：纵观AI芯片在国内的发展史，AI芯片国产化进程大致分为三个时代。

1.0时代，是属于ASIC架构的时代

自2000年互联网浪潮拉开AI芯片的序幕后，2010年前后，数据、算法、算力和应用场景四大因素的逐渐成熟，正式引发AI产业的爆发式增长。申威、沸腾、兆芯、龙芯、魂芯以及云端AI芯片相继问世，标志着国产AI芯片正式启航。2016年5月，当谷歌揭晓AlphaGo背后的功臣是TPU时，ASIC随即成为“当红辣子鸡”。于是，在2018年，国内寒武纪、地平线等国内厂商陆续跟上脚步，针对云端AI应用推出ASIC架构芯片，开启国产AI芯片1.0时代。ASIC芯片，能够在某一特定场景、算法较固定的情况下，实现更优性能和更低功耗，基于此，满足了企业对极致算力和能效的追求。所以当时的厂商们，多以捆绑合作为主：大多芯片厂商寻找大客户们实现“专用场景”落地，而有着综合生态的大厂选择单打独斗。地平线、耐能科技等AI芯片厂商，分别专注AI芯片的细分领域，采用“大客户捆绑”模式进入大客户供应链。在中厂们绑定大客户协同发展之际，自有生态的大厂阿里成立独资芯片公司平头哥，着眼AI和量子计算。2019年，平头哥发布的第一款AI芯片含光800，便是基于ASIC架构打造，用于云端推理。据阿里介绍，1颗含光800的算力相当于10颗GPU，含光800推理性能达到78563 IPS，能效比500 IPS/W。相比传统GPU算力，性价比提升100%。在1.0时代，刚出世的国内芯片厂商们选择绑定大客户，有综合生态的大厂选择向内自研，共同踏上探索AI芯片算力的征途。

2.0时代，更具通用性的GPGPU“引领风骚”

尽管ASIC有着极致的算力和能效，但也存在着应用场景局限、依赖自建生态、客户迁移难度大、学习曲线较长等问题。于是，通用性更强的GPGPU在不断迭代和发展中成为AI计算领域的最新发展方向，当上AI芯片2.0时代的指路人。自2020年起，以英伟达为代表的GPGPU架构开始有着不错的性能表现。通过对比英伟达近三代旗舰产品发现，从FP16 tensor 算力来看，性能实现逐代翻倍的同时，算力成本在下降。于是，国内多个厂商纷纷布局GPGPU芯片，主打CUDA兼容，试探着AI算力芯片的极限。2020年起，珠海芯动力、壁仞科技、沐曦、登临科技、天数智芯、瀚博半导体等新势力集结发力，大家一致的动作是：自研架构，追随主流生态，切入边缘侧场景。在前两个时代中，国产AI芯片厂商都在竭力顺应时代潮流，前赴后继地跟随国际大厂的步伐，通过研发最新芯片解决AI算力芯片的挑战。我们能看到的变化是，在2.0时代中，国产AI芯片厂商自主意识觉醒，尝试着自研架构以求突破。

3.0时代，存算一体芯片或成GPT-4等大模型的最优选

ASIC芯片的弱通用性难以应对下游层出不穷的应用，GPGPU受制于高功耗与低算力利用率，而大模型又对算力提出前所未有的高要求：目前，大模型所需的大算力起码是1000TOPS及以上。以2020年发布的GPT-3预训练语言模型为例，其采用的是2020年最先进的英伟达A100 GPU, 算力是624TOPS。2023年，随着模型预训练阶段模型迭代，又新增访问阶段井喷的需求，未来模型对于芯片算力的需求起码要破千。再例如自动驾驶领域，根据财通证券研究所表明，自动驾驶所需单个芯片的算力未来起码要1000+TOPS：2021年4月, 英伟达就已经发布了算力为1000TOPS的DRIVE Atlan芯片；到了今年，英伟达直接推出芯片Thor，达到2000TOPS。由此，业界亟需新架构、新工艺、新材料、新封装，突破算力天花板。除此之外，日渐紧张的地缘关系，无疑又给高度依赖先进制程工艺的AI大算力芯片厂商们提出新的挑战。在这些大背景下，从2017年到2021年间集中成立的一批初创公司，选择跳脱传统冯·诺依曼架构，布局存算一体等新兴技术，中国AI芯片3.0时代，正式拉开帷幕。目前存算一体，正在上升期：学界，ISSCC上存算/近存算相关的文章数量迅速增加：从20年的6篇上涨到23年的19篇；其中数字存内计算，从21年被首次提出后，22年迅速增加到4篇。产界，巨头纷纷布局存算一体，国内陆陆续续也有近十几家初创公司押注该架构：在特斯拉2023 Investor Day预告片末尾，特斯拉的dojo超算中心和存算一体芯片相继亮相；在更早之前，三星、阿里达摩院包括AMD也早早布局并推出相关产品：阿里达摩院表示，相比传统CPU计算系统，存算一体芯片的性能提升10倍以上，能效提升超过300倍；三星表示，与仅配备HBM的GPU加速器相比，配备HBM-PIM的GPU加速器一年的能耗降低了约2100GWh。目前，国内的亿铸科技、知存科技、苹芯科技、九天睿芯等十余家初创公司采用存算一体架构投注于AI算力，其中亿铸科技、千芯科技偏向数据中心等大算力场景。现阶段，业内人士表示，存算一体将有望成为继CPU、GPU架构之后的第三种算力架构。该提法的底气在于，存算一体理论上拥有高能效比优势，又能绕过先进制程封锁，兼顾更强通用性与更高性价比，算力发展空间巨大。在此基础上，新型存储器能够助力存算一体更好地实现以上优势。目前可用于存算一体的成熟存储器有NOR FLASH、SRAM、DRAM、RRAM、MRAM等。相比之下，RRAM具备低功耗、高计算精度、高能效比和制造兼容CMOS工艺等优势：目前，新型存储器RRAM技术已然落地：2022上半年，国内创业公司昕原半导体宣布，大陆首条RRAM 12寸中试生产线正式完成装机验收，并在工控领域达成量产商用。据昕原半导体CTO仇圣棻博士介绍，昕原RRAM产品的良率已经超过93%。随着新型存储器件走向量产，存算一体AI芯片已经挺进AI大算力芯片落地竞赛。而无论是传统计算芯片，还是存算一体芯片，在实际加速AI计算时往往还需处理大量的逻辑计算、视频编解码等非AI加速计算领域的计算任务。随着多模态成为大模型时代的大势所趋，AI芯片未来需处理文本、语音、图像、视频等多类数据。对此，初创公司亿铸科技首个提出存算一体超异构AI大算力技术路径。亿铸的畅想是，若能把新型忆阻器技术(RRAM)、存算一体架构、芯粒技术（Chiplet）、3D封装等技术结合，将会实现更大的有效算力、放置更多的参数、实现更高的能效比、更好的软件兼容性、从而抬高AI大算力芯片的发展天花板。

站在3.0时代门口，国产AI大算力芯片厂商自主意识爆发，以期为中国AI大算力芯片提供弯道超车的可能。AI芯片市场的发展动力，大抵来源于以下几个因素。

中央与地方政府正为提供充足算力而奔波2023年2月，中央政府发布多个相关报告与布局规划，强调东数西算中算力的调动，目前已落下一子：东数西算一体化服务平台。地方政府层面，例如成都在2023年1月，发布“算力券”，即将政府算力资源与算力中介服务机构、科技型中小微企业和创客、科研机构、高校等共享，有效提高算力利用率；北京在2023年3月，发布加快落实算力的相关意见，加快计算中心、算力中心、工业互联网、物联网等基础设施建设。基于国家与地方政府相关政策指引，AI厂商们纷纷建立起超算/智算中心，较于以往不同的是，今年算力的首个市场化运作模式诞生，智算中心算力的规模也实现质的飞跃：据国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》显示，目前全国有超过30个城市正在建设或提出建设智算中心。

AI芯片产业布局规划持续落地可以看到，关于AI芯片政策已从“十三五”的规划阶段，来到“十四五”的落地阶段：提高AI芯片研发技术，推广AI应用。同时，各地明确提出，要加强AI芯片产业布局。在这之中，浙江、广东、江苏等省份均提出了至2025年，人工智能芯片领域的具体发展方向。

存算一体正成为地方算力产业新机遇存算一体，正成为深圳算力产业链创新发展的新机遇，并在积极落地之中。2023年4月2日，在第二届中国产业链创新发展峰会新一代信息技术产业发展论坛上，北京大学深研院信息工程学院副院长杨玉超表示，深圳将立足于相对完善的产业链集群，从先进工艺与封装、创新电路与架构、EDA工具链、软件与算法生态这四个方面解决存算一体在产业化应用上的挑战。今年4月，中国大模型正式爆发，未来，对于AI大算力芯片的需求只增不减。现有的大模型，正向着英伟达A100大算力芯片狮子大开口：故例如商汤等AI厂商，正把眼光放置在国产AI大算力芯片上：2023年4月10日商汤披露，目前商汤所用的国产化AI芯片占比达到总体的10%。这无疑，将加速国内AI芯片厂商的成长。

千亿美元的AI芯片市场，2023火得滚烫整体人工智能产业链，基本分为基础层、技术层和应用层三个层面：基础层包括AI芯片、智能传感器、云计算等；技术层包括机器学习、计算机视觉、自然语言处理等；应用层包括机器人、无人机、智慧医疗、智慧交通、智慧金融、智能家居、智慧教育、智慧安防等。基础层作为人工智能行业发展的基础，为人工智能提供数据和算力支撑，其中，AI芯片是人工智能算力的基础。在AI产业尚未成熟之时，基础层企业当前价值量最大，中国人工智能产业链中，基础层企业比例达到83%，技术层企业比例为5%，应用层企业比例为12%。基础层决定大楼是否稳固，而下游的应用层面决定大楼高度。在应用层，智能机器人、无人机等智慧终端潜力无限，智慧城市、智慧医疗等领域，更是有不少金子能挖。目前，我国智能机器人市场规模持续快速增长。数据显示，2017-2021年我国智能机器人市场规模从448亿元增长至994亿元，期内年均复合增长率达22.05%，预计2023年其市场规模将达1300亿元。据中国信通院数据统计，中国智慧城市市场规模近几年均保持30%以上增长，2021年市场规模达21.1万亿元，预计2023年其市场规模将达28.6万亿元。千亿美元市场，AI芯片魅力无限在全球数字化、智能化的浪潮下，技术层的技术正不断迭代：自动驾驶、影像辨识、运算等技术正在各领域深化应用；与此同时，应用层的物联网设备正不断丰富：工业机器人、AGV/AMR、智能型手机、智能音箱、智能摄影机等。这无疑，会推动基础层的AI芯片与技术市场迅速成长。根据灼识咨询数据，2022年全球AI芯片市场规模达到960亿美元，预计2027年达到3089亿美元，2022年至2027年的复合年增长率为23%：国内的AI芯片市场，更为火热：根据灼识咨询数据，2022年中国AI市场规模达到319亿美元，预计于2027年将达到1150亿美元，2022年至2027年的复合年增长率为29.2%。2021，AI芯片赛道迎来风口随着下游安防、汽车等市场需求量增大，再加上2019年以来，美国持续制裁国内厂商的动作，2021年，国内AI芯片赛道迎来风口。在这一年里，资本们竞相挑选属于中国AI芯片市场的“潜力狗”，以期掌握未来芯片市场的话语权。尽管2022年投资热度有所回落，但总体金额仍超百亿元。（2016-2023年中国人工智能芯片行业融资整体情况图源：前瞻经济学人APP）

C轮后的融资较少，AI芯片市场仍处于萌芽期通过分析投资轮次发现，AI芯片市场仍处于萌芽期：目前人工智能芯片行业的融资轮次仍处于早期阶段，C轮后的融资数量较少。（2016-2023年中国人工智能芯片行业投融资轮次情况图源：前瞻经济学人APP）存算一体成为香饽饽细分赛道来看，GPU是价值量最高的赛道，摩尔线程等GPU玩家融资超10亿，荣获“MVP”；而存算一体赛道融资公司数量最多，亿铸科技、知存科技等七家存算一体玩家，备受资本青睐。值得注意的是，存算一体赛道下的四家初创公司亿铸科技、知存科技、苹芯科技、后摩智能，已连续两年获得融资。国内AI大算力赛道，玩家几何？目前，寒武纪、平头哥等1.0时代玩家，现已成为优质AI算力芯片上市公司；2.0时代涌现的非上市AI算力芯片公司如壁仞科技、登临科技、天数智芯等在产品端持续发力；3.0时代，千芯科技、亿铸科技等初创公司正在存算一体这一架构上寻求突破。经偲睿洞察整理发现，目前，多数AI芯片公司布局边缘侧、中心侧偏小算力场景，例如智慧安防、智慧城市、智慧医疗等应用场景；壁仞科技、平头哥、亿铸科技能够覆盖边缘侧、中心侧偏大算力场景；在新一批初创企业中，亿铸科技做出大胆的尝试，试图用存算一体架构去做大算力场景。故，我们按照架构以及应用场景分类，呈现出以下AI算力芯片中游厂商全景图：

ChatGPT火爆来袭，引发AI产业巨浪，国产AI芯片正迎来3.0时代；在3.0时代，更适配大模型的芯片架构——存算一体将崭露头角，同时系统级创新将成为未来的发展趋势，抢先下注的厂商将先吃到ChatGPT带来的红利。本文为专栏作者授权微新创想发表，版权归原作者所有。文章系作者个人观点，不代表微新创想立场，转载请联系原作者。如有任何疑问，请联系http://www.idea2003.com/。

大模型浪潮下AI芯片厂商的机遇挑战与国产化趋势

最新快讯

2026年04月16日

OpenAI推出全新Agents SDK沙箱功能提升企业智能代理安全性

AI服务器安全危机：MCP设计缺陷影响超20万台设备

芒果TV会员破7560万 AI转型成果显著自研大模型助力节目生产效率提升

“芯链智造”春季路演4月28日苏州启幕聚焦数字化工具与ESG合规管理

黄仁勋谈英伟达AI投资策略：不押注赢家坚持广泛布局

Zorin OS 18.1发布强化Windows应用兼容与硬件支持体验

LG推出全球首款39英寸5K2K OLED显示器UltraGear evo 39GX950B-B售价13999元

安井食品携手钉钉开启数智化转型新篇章智能办公与AI应用助力全球化发展

罗姆半导体京东自营旗舰店上线，全面布局中国市场提升服务体验

河北顺丰与锦江酒店携手打造旅游智能寄存新体验

微信分付上线好友转账功能并推出利率优惠活动

快手国风女装直播盛典4月18日启幕沉浸式秀场购物新体验