ChatGPT的横空出世,犹如一场科技界的狂欢盛宴,迅速席卷了各行各业。无论是深耕AI领域的专业人士,还是对科技趋势保持敏锐的普通大众,都感受到了这股势不可挡的热浪。一时间,”AIGC”成为街头巷尾热议的话题,成为人们交流的必备词汇。ChatGPT的诞生不仅标志着AI发展的”iPhone时刻”到来,更在低迷的全球半导体市场掀起了一股强劲的上升浪潮。据毕马威权威报告显示,ChatGPT等人工智能平台的涌现,将催生全新的应用场景和商业模式,预计在未来几年内创造数千亿美元的产业价值。

然而,这个被誉为”超费电”、”超费钱”又”超聪明”的AI巨头,也引发了社会各界的诸多思考与焦虑。前微软全球副总裁、百度COO、奇迹创坛创始人陆奇曾公开表示:”从现在开始,无论从事工作还是创业,都必须与AI产生关联。”他强调”AIGC并非短暂的投机风口,而是对世界发展具有深远影响的变革力量”,”时代正在发生深刻变革,我们每个人都应该积极适应新的发展格局”。

AI 2.0时代的号角已经吹响,各大”108模型”纷纷崭露头角,谁能成为MaaS领域的”四小龙”,或许几年后回望,2023年将成为人工智能发展史上浓墨重彩的一笔。正如《2001太空漫游》中那块神秘的黑色石板,第一次出现时,猿猴们好奇地围绕它打转,最终在它的启发下学会了使用工具,完成了从猿到人的进化;而当我们再次见证它的出现时,它又引领人类向着更高维度迈进,穿越浩瀚星海,直至成为宇宙的探索者。

2012年,AlexNet以惊人的表现摘得ImageNet图像识别桂冠,将识别准确率提升至85%。以CNN为核心的人工智能技术开始超越人类,在计算机视觉等领域取得突破,标志着AI 1.0时代的开启。十年后的2022年底,ChatGPT横空出世,凭借海量数据训练的强大能力,打破了传统NLP人机交互中”人工智障”的刻板印象,推动各行各业的AI应用迈入2.0时代。我们何其幸运,能在短短十年间见证人工智能跨越两个时代的重大突破。

自今年3月起,AIGC与大模型产品如雨后春笋般涌现,呈现出百花齐放的繁荣景象。AI领域的模型迭代已进入每周更新的节奏。就在不久前,Meta宣布将其LLama2模型开放商用。模型规模不断扩大,应用场景日益丰富。目前国产大模型数量已达108个,正如水浒传中的108位好汉,人工智能领域的自媒体甚至以”谁是36天罡?谁是72地煞?”为题,评选出百模争霸推荐榜。在刚刚闭幕的2023年世界半导体大会上,AI大算力芯片公司亿铸科技副总裁李明发表了题为《以存算一体架构创新,迎AI 2.0时代》的演讲,预测最早明年,国内将初步形成MaaS(模型即服务)四小龙的竞争格局。这与2014-2017年间,基于CNN AI网络形成的CV(机器视觉)应用四小龙格局如出一辙,并引领了AI视觉领域数年的蓬勃发展。

算力与能源的双重挑战,成为制约AI发展的关键瓶颈。生成式AI的惊艳表现背后,离不开超大算力的强大支撑。最近,IDC、浪潮信息和清华大学全球产业研究院联合发布的《2022-2023全球计算力指数评估报告》指出:”计算力与经济增长密切相关,计算力指数每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰”,首次揭示了”算力即生产力”的真理。Transformer的划时代革新,不仅将推动AI向通用人工智能AGI领域发展,更将引发第二次AI应用场景的爆发。而这一进程将产生上千亿美元的算力需求。据中国信通院等机构调研数据显示,ChatGPT单日运营算力消耗占整个2021年中国智能算力总规模的3%。这还只是OpenAI的一个模型,若中国百大模型持续发展,对国内智能算力的需求将达到惊人的天文数字。

假设ChatGPT3平均每张H100每秒可生成6个tokens(FP16,参数350GB),不考虑级联或模型稀疏化,假设每人每天提5个问题,每个问题与GPT交互5次,每次消耗30个token,那么每人每天会消耗750个token。若每天有1亿人在线使用,就需要约15万颗H100芯片,仅H100卡的硬件成本就超过50亿美元。若计算整个计算系统成本,100亿美元也难以覆盖。李明补充道。

算力需求不断提升带来的挑战不仅在于昂贵,更在于耗电。在今年国际集成电路设计领域最高档会议ISSCC上,AMD全球CEO LisaSu表示,目前实现Exascale(百亿亿次计算)的顶尖计算机功耗已达2100万瓦。而根据Green500的预测,到2035年,实现Zettascale(十万亿亿次计算)的顶尖计算机功率将达500MW,相当于半个核电站的发电功率。而2035年并不遥远。回到ChatGPT3的场景假设,亿铸科技认为,未来随着大模型普及,若有1亿人同时在线,在线提问率提升至30%,每个prompt占30个token,就需要约1700万颗H100芯片提供推理算力,每颗H100功耗约750W。假设模型每天运行10小时,这些H100芯片所在数据中心一年的耗电量将超过三峡大坝一年的发电量。

从技术环境来看,未来数据量将持续增长,模型算法日益复杂,算力需求不断提升,而支撑底层算力的摩尔定律已接近极限。巨大的发展剪刀差落在AI大算力芯片企业产业链的肩上,带来了前所未有的压力:如有效算力增长率、软件编译效率、数据带宽、存储成本、能效比、生产工艺等。以AI云端推理卡为例,近年来由于工艺制程”卷不动”等原因,成本、功耗、算力难以兼顾。目前国内主流AI芯片厂商和初创企业纷纷寻求计算架构创新,试图在性能、规模和能源利用率之间找到平衡点,突破算力天花板。清华大学集成电路学院副院长尹首一教授认为,在当前国际产业环境下,需要重新审视芯片算力公式,在可获取的低世代成熟工艺中寻找持续提升算力的新途径,包括探索芯片面积上的先进集成技术和先进封装技术,以及在算力方面更加聚焦新型计算架构。

存算一体化概念的提出最早可追溯至上世纪七十年代,斯坦福研究所的Kautz教授团队于1969年提出了这一理念,旨在通过直接利用内存进行简单计算,减少数据在处理器与存储器之间的传输。2016年,ISCA上开始出现存算一体相关论文。到了Micro 2017,英伟达、英特尔、微软、三星、加州大学圣塔芭芭拉分校等纷纷推出存算一体系统原型。世界上首颗存算一体芯片于ISSCC 2018年首次亮相,今年已是存算一体芯片工程落地走过的第七个年头。近年来,关于存算一体的报道和研究源源不断涌现。学界,ISSCC上存算/近存相关文章数量迅速增加:从20年的6篇上涨到23年的19篇;其中数字存内计算,从21年首次提出后,22年迅速增加到4篇。产界,巨头纷纷布局存算一体,国内也陆续有近十几家初创公司押注该架构,这”扶摇直上”的架势,不仅因为存算一体是天生为AI大模型计算而生的架构,乘了大模型的”东风”,更因为该架构解决了长久以来制约算力发展的根本问题——”存储墙”。

存算一体架构是相对于传统冯·诺伊曼架构下的存算分离而言的。从技术理论角度来看,需要从阿姆达尔定律讲起。阿姆达尔定律是硬件加速设计的基本定律,包括两个因子:一个是加速器规模α,可以通过先进工艺或优化设计提升工作频率,叠加后就形成”裸算力”;另一个因子F则是在计算周期里数据访存所占的百分比。IBM科学家研究发现,在存算分离的冯·诺依曼架构下,F值高达90%以上,意味着每次计算,数据搬运访存的时间超过90%,功耗也超过90%。这意味着即使现在使用5nm工艺,将来做到0.5nm;现在花费1亿美元做一颗芯片,将来花费10亿美元,性能提升空间也只有10%。那么,如何减小F值呢?近存储计算是一种途径。例如,特斯拉的Dojo D1采用近存储技术,如果能将F值降到0.2-0.3,即使工艺仍是7nm,性能也会提升3-4倍。存内计算则是更进一步——亿铸科技希望通过存算一体(CIM)将F值降低到0.1以下,如此一来,未来芯片的性能提升将主要取决于工艺的提升和设计的优化。

存算一体超异构开启AI算力芯片换道发展之路。据李明透露,亿铸科技早已根据ReRAM(RRAM)特性,使用先进异构封装方式实现系统级芯片优化方案;今年3月,亿铸科技正式公布了存算一体超异构芯片这一创新理念。它将以存算一体(CIM)AI加速计算单元为核心,同时将不同计算单元进行异构集成,实现更大的AI算力以及更高的能效比,同时提供更为通用的软件生态,使CIM AI大算力芯片真正满足AI算力增长第二曲线的需求,开启一条AI大算力芯片换道发展之路。这颗存算一体芯片可实现基于75W功耗达到单芯片1P算力,相比传统冯·诺依曼架构的AI推理芯片提升10倍左右的能效比,同时还能兼顾软件通用性。李明表示,通过亿铸”四新一强”的整体优势——存算一体架构创新、ReRAM新型忆阻器应用创新、全数字化技术路径应用创新、存算一体超异构系统级创新以及极强的专业团队阵容,一定能够成为AI2.0时代破局的一道光。

最新快讯

2026年02月10日

16:14
微新创想:17年前的春晚,蔡明和郭达这两位春晚常驻嘉宾表演了小品《家有毕业生》。大学生们一边看着电视屏幕上蔡明老师「费尽心机」帮刚刚大学毕业的儿子「卖土豆」,一边又盯着自己的电脑屏幕,在《QQ农场》种下一颗又一颗的「土豆」。蔡明已成为了一代人的春晚记忆符号,她上一次上春晚,是2019年。而《QQ农场》随着时间的推移,似乎被沉淀在了移动互联之前的时代。 17年...
16:14
微新创想:远离屏幕,更多是因为“脑仁疼”上瘾、爱玩,二十多年前“上线”的智能手机,成了我们最离不开的物件。Eyesafe 报告以当前趋势推算,一个人一生中可能有四分之一的时间都在盯着屏幕,总暴露时长预计超过18万小时,手机在其中“居功至伟”。而人脑的平衡机制,让已经深陷其中的我们开始想要逃离。下了班之后,有意无意地规避手机的使用。海外用户也是如此,德勤此前的...
16:13
微新创想:今年年夜饭吃什么?这个问题的答案,很多人其实早就“吃”过了,不过不是在饭桌上,而是在抖音、小红书等社交平台的视频里。春节临近,年味已经提前上线。有人复刻奶奶的老味道,有人用龙井茶炖出江南年菜,还有人干脆在村里办起厨艺大赛,全村围坐吃席。一场全民参与的“云上年夜饭”,正让年味提前升温。截至发稿前,抖音话题#抖音年味争霸赛已超35亿播放,#春节美食挑战...
15:59
微新创想:2026年2月,峰飞航空科技自主研发的5吨级eVTOL“V5000天际龙”在江苏昆山民用无人机试飞运行基地成功完成垂直起飞、正向转换、反向转换及降落的全流程转换飞行。此次试飞标志着该机型在实际应用环境中的重要进展。 微新创想:V5000天际龙采用了复合翼与三翼面的创新布局设计,使其在空气动力学性能上达到新的高度。机身配备了20台第五代升力电机,不仅...
15:59
微新创想:2026年2月10日,汽车媒体CarScoops发布现代途胜(Tucson)改款原型车路测图。该车为现代旗下最畅销SUV的中期改款车型,于韩国及北美地区进行测试。 新车采用近似封闭式前格栅设计,整体造型更加紧凑。日行灯采用棱角分明的造型,增强了车辆的辨识度和视觉冲击力。车身线条流畅,呈现出强烈的运动感,同时蚌壳式引擎盖的设计进一步提升了车辆的豪华感...
15:59
微新创想:2026年2月10日 银欣正式上线面向单路服务器处理器的高性能一体式水冷散热器XE420 该产品采用全铜镀镍冷头 28mm厚铝制冷排及三颗14034工业级LCP扇叶风扇 集成4000 RPM三相六极水泵 其冷头配备大尺寸微水道铜底板 支持多平台安装套件选配 适配主流服务器与工作站平台 风扇转速800–2500 RPM 最大风量123.8 CFM 噪...
15:59
微新创想:2026年2月9日,谷歌Android新系统Aluminum OS被曝将在桌面端深度集成Gemini。这一消息引起了广泛关注,显示出谷歌在人工智能助手领域的进一步布局。据最新测试版Google App(v17.5)代码显示,Gemini将作为系统级的全局助手,用户可以通过状态栏右上角的图标或“Google键+空格”的快捷方式来启动它。这种设计方式与...
15:59
微新创想:2月10日,上海普陀区万里街道联合淘宝闪购等机构启动“AI+老年助餐”试点项目。该项目面向辖区内的100位老年人发放体验券,旨在通过科技手段提升他们的用餐体验。试点服务支持老年人使用千问APP、天猫精灵等智能终端进行语音点餐,为他们提供更加便捷的订餐方式。 微新创想:此次试点是淘宝闪购首次系统性地将AI语音点餐技术应用于社区老年助餐服务。这一举措不...
15:59
微新创想:2026年2月,浙江宁波警方成功侦破一起涉及无人机飞控系统非法破解的案件。该案主犯李某等人通过远程操控手段,非法解除无人机的电子围栏、禁飞区及限高功能,为221人次提供破解服务,涉案金额达10万余元。该行为严重违反了相关法律法规,对公共安全构成了潜在威胁。 微新创想:案件的起因是一名无人机爱好者廖某某,因拍摄需求高价购买了非法破解服务。在使用该破解...
15:59
微新创想:2026年春季,问界M6增程版将在国内正式发布。该车提供180公里、260公里和272公里三种CLTC纯电续航版本,满足不同用户的出行需求。搭载37千瓦时与53千瓦时两种电池组,为车辆带来更长的续航能力和更强的性能表现。 车身尺寸为4960×1985×1736毫米,轴距2950毫米,展现出宽敞的内部空间和良好的驾乘体验。前脸采用家族式设计,配备激光...
15:58
微新创想:2026年2月10日 汽车媒体CarBuzz曝光现代第八代伊兰特冬季测试谍照 现代第八代伊兰特的谍照在2026年2月10日被汽车媒体CarBuzz曝光 该车预计将在2027年正式发布 定位为一款燃油家用轿车 但整体设计方向明显向豪华电动车标准靠拢 测试车队中出现了奔驰CLA纯电版 这一细节凸显了现代在电动车领域的升级意图 新车采用了方正化的造型设计...
15:58
微新创想:2026年2月10日 AYANEO掌机官方B站账号发布声明 AYANEO掌机官方B站账号于2026年2月10日发布声明 AYANEO掌机官方B站账号针对近期网络上流传的不实信息作出回应 声明中指出公司经营合规 员工薪资按时足额发放 AYANEO已提供近半年银行回单作为证据 针对QQ账号“真南哥”等发布的谣言 AYANEO已采取法律行动 公司已向公安...