编者按:本文精选自微信公众号《有新Newin》(ID:NewinData),经微新创想授权转载。近期,知名投资人Stephanie Smith与资深科技记者Guido Appenzeller就当前人工智能创投生态展开深度对话,聚焦AI算力成本与市场可持续性等核心议题。本次对谈内容涵盖LLM训练成本、数据瓶颈、模型规模、训练数据量及硬件演进等多个维度,完整对话实录如下:

Stephanie Smith指出,Guido在最新文章中强调AI计算成本居高不下,并指出计算资源获取已成为AI企业成功的决定性因素。这一趋势不仅适用于构建超大规模模型的头部企业,更普遍的是,许多公司将其80%以上的融资资本投入计算资源。这一现象自然引发了一个关键问题:AI算力投入的可持续性究竟如何?

Guido Appenzeller回应道,早期阶段构建的核心技术需向完整产品形态演进,涉及更多功能验证与实施细节。若面向企业客户,还需处理复杂的行政管理事务,这意味着非AI传统软件开发工作量将显著增加,相应的人力成本也随之提升。他预测,虽然计算成本占比会随时间推移逐渐下降,但绝对金额在短期内仍将持续增长——毕竟当前AI繁荣期尚处于早期阶段。

Stephanie Smith强调,AI发展才刚刚起步。在第二部分讨论中,她指出计算需求短期内难以缩减,而基础设施的自主投资或租赁决策对企业的盈利能力具有决定性影响。此外,批处理规模、学习率及训练周期等参数也会显著影响最终成本构成。

Guido Appenzeller进一步解析,模型训练成本受多重因素影响。好消息是,当前主流模型多采用Transformer架构——这一AI领域的重大突破。相较于传统模型,Transformer架构具有更高的灵活性和并行处理能力,训练效率显著提升。具体而言,Transformer模型的推理时间约等于参数数量的两倍浮点运算,而训练时间则约为参数数量的六倍。以GPT-3为例,该模型拥有1750亿个参数,进行一次推理需约3500亿次浮点运算。这一计算方法可帮助企业评估所需计算能力、成本预测及定价策略,同时也能估算模型训练所需时长及AI加速器的浮点运算能力。

Stephanie Smith以GPT-3为例,直观展示模型训练与推理所需的计算资源。Guido Appenzeller指出,若采用理想化计算方式,基于GPT-3的参数数量与训练数据规模,可得出约3×10^23次浮点运算的需求——这一数字包含23个零,难以直观理解。以A100显卡为例(当前主流计算设备之一),其单秒可执行浮点运算次数已知。通过数据对比,可得出粗略的训练时长估算。考虑到A100租赁成本约1-4美元/小时,初步计算显示训练成本约50万美元。但需注意,该分析未考虑优化措施、内存带宽限制、网络瓶颈及多次测试运行等因素。实际观察显示,当前行业内的LLM训练成本已远超预期,可能达到数百万美元级别。主要原因是计算资源预约周期长,若需在2个月内使用全部显卡,实际成本可能增加12倍,相当于在基础成本上增加一个数量级。

Stephanie Smith补充道,与训练成本相比,推理成本要低得多。对于现代文本模型,训练数据规模约1万亿个token,而推理过程每个单词作为一个token输出,速度约是训练的1万亿倍。这意味着计算一个LLM的推理成本仅增加几分钱到几分之一钱。但需特别指出,推理成本受峰值容量约束影响显著——例如,若模型在周一上午9点达到使用峰值,企业仍需承担周六午夜时的全部费用,这会大幅推高成本。对于特定图像模型,可采用成本更低的显卡进行推理,因为模型规模较小,可在消费级显卡的服务器版本上运行,从而节省大量开支。

Stephanie Smith提出,正如前文所述,单纯堆砌低性能芯片无法弥补训练过程中的低效率。Guido Appenzeller强调,训练过程需要高度复杂的软件支持,因为跨卡数据分配的损耗可能超过硬件性能提升带来的收益。但对于推理而言,情况则截然不同。

Guido Appenzeller解释道,推理过程通常可在单张显卡上完成。以Stable Diffusion这类热门图像生成模型为例,其可在MacBook等消费级设备上运行,前提是设备具备足够的内存和计算能力。这意味着无需使用A100等高端显卡,即可实现成本可控的推理部署。

Stephanie Smith进一步提出,既然模型训练的计算量远超推理,且计算投入通常与模型质量正相关,那么是否意味着资本雄厚的传统企业将主导这场竞赛?Guido Appenzeller坦言,这是一个价值万亿美元级别的问题。他首先指出,训练LLM的高昂成本是阻碍开源LLM发展的重要原因——尽管许多开发者有意愿参与,但获取数百万美元级别的计算资源仍是巨大障碍。不过,他同时认为,随着技术进步,训练成本有望下降。一方面,数据获取可能成为新的瓶颈;另一方面,模型规模与最佳训练数据量存在对应关系。一个LLM若缺乏足够的数据支撑,其价值将大打折扣;反之,若数据量充足但模型规模过小,同样无法发挥应有效能。他比喻道,模型规模与人类知识积累存在某种平衡关系,就像大脑容量与教育年限的对应。当前大型模型已涵盖互联网约10%的内容(包括维基百科、海量书籍等),未来可能存在10倍级增长空间,但100倍级增长则难以实现——毕竟人类知识创造速度有限。因此,他预测训练成本可能达到峰值后趋于平稳,主要得益于硬件性能提升,但数据获取增长将放缓,除非出现新的数据生成方法。基于这一判断,他相信由资本驱动的巨头企业构建的模型,更像是一个加速器而非壁垒,因为资金充足的初创公司完全有能力训练LLM,未来该领域仍将涌现大量创新突破。

最新快讯

2025年08月17日

14:53
8月17日,随着南海热带低压的步步紧逼,国铁广州局果断启动应急预案,对琼州海峡过海普速列车实施全面运行调整。受此热带低压影响,为确保铁路运输安全万无一失,相关部门对过海列车采取了系列优化措施,包括调整运行区段以及部分线路的临时停运。根据最新安排,所有往返海南岛的过海列车将统一调整至广州白云站或湛江西站终到或始发,而深圳东往返三亚方向的列车则暂停运营。此次调整...
14:53
罗永浩近日在微博上透露董宇辉自立门户后年收入高达二三十亿元,这一消息迅速引发广泛关注。然而,与辉同行方面迅速作出回应,明确辟谣该信息并不属实。事实上,今年1月董宇辉曾以28.541亿元的年收入登顶年度中国网络主播净收入榜,但他在直播时已公开否认相关传言,并表达了对造谣信息的困扰。这一事件再次凸显了网络主播收入数据的复杂性和争议性,也引发了公众对于网络名人财富...
14:53
2025年8月10日至16日期间,广东省卫生部门监测到基孔肯雅热本地感染病例830例,其中无重症及死亡病例报告,显示出较高的流行态势。此次疫情呈现明显的地域聚集性特征,主要病例集中在珠三角核心城市佛山,累计报告644例,占全省病例总数的77.6%,凸显了该区域需加强防控力度。 据疾控部门最新通报,广州地区报告85例确诊病例,位居全省第二;湛江、深圳、惠州三市...
13:44
Faraday Future(FF)于8月17日正式官宣其创新战略布局,全面启动"EAI+Crypto"双飞轮&双桥梁生态战略。此举标志着FF在加密金融领域迈出重要步伐,不仅推出美股市场首个十大加密资产一篮子组合指数型C10 Treasury(财库)计划,还同步发布了权威"C10指数"。该战略的核心目标是通过深度整合加密资产与传统金融工具,构建全新的...
13:44
8月17日,光弘科技在官方互动平台发布重要消息,宣布旗下AC公司近期成功斩获超过5000万欧元的新产品定点订单,这一亮眼成绩主要得益于汽车发动机及发电机控制电路产品的强劲需求。据悉,AC公司正积极与多家潜在客户展开深度合作洽谈,有望进一步扩大市场份额。这一系列成果的取得,根本原因在于光弘科技对AC公司的战略性收购,此举被视为公司全球化布局的关键落子,未来AC...
13:44
2025年8月17日最新市场动态显示,南向资金在本周呈现显著活跃态势,共有19只个股的持股量实现环比增长超过10%,其中氢能板块表现尤为抢眼。国富氢能、蓝思科技、峰岹科技等三只股票的持股量增幅更是超过100%,被市场视为重点加仓对象,显示出资金对氢能产业未来发展的强烈信心。此外,德林控股和瑞浦兰钧的持股量增幅也超过40%,进一步印证了南向资金对部分优质标的的...
13:44
8月17日,公募FOF市场迎来五年来的最佳表现,这一显著回升主要得益于对医药、科技类股票基金的超配布局。数据显示,全市场超过九成的FOF产品年内收益实现正向增长,其中表现最佳的产品收益率更是高达34.28%。这一成绩与2022年最佳收益仅0.29%的情况形成鲜明对比,凸显出FOF市场正经历明显的回暖趋势。 统计分析显示,今年FOF业绩提升的关键策略在于排名前...
12:43
8月17日,南海热带低压强势北上,海南岛迎来强降雨天气。受其影响,全岛多地遭遇大到暴雨袭击,局部地区更是出现短时强降水,导致部分河流水位急剧上涨,防汛压力骤增。为有效应对可能发生的中小河流超警洪水,水利部于当日11时果断启动洪水防御Ⅳ级应急响应,全面部署各项防汛措施,确保人民群众生命财产安全。此次应急响应的启动,标志着海南防汛工作已进入关键阶段,相关部门正密...
12:43
8月16日,随着西藏定日县蔚来换电站的正式投运,蔚来在G318川藏线上的换电站布局迎来了第15个重要节点,实现了全线贯通。这条被誉为"天空之路"的G318川藏线,横贯成都至拉萨,全长约2410公里,是连接中国东西部的重要交通动脉。如今,随着蔚来换电站的陆续建成,这条充满挑战的线路为新能源车长途出行提供了前所未有的便利。蔚来换电站的投运不仅完善了公司在西藏地区...
12:43
2025年8月17日,备受瞩目的济南黄岗路黄河隧道传来重大突破——盾构段实现全面贯通这一历史性时刻标志着我国隧道工程技术再攀高峰。该隧道项目采用直径17.5米的"山河号"盾构机进行施工,这种世界级超大直径盾构机在黄河水域的复杂地质条件下展现了卓越性能。作为济南城市建设集团重点投资建设的民生工程,该项目由中铁十四局集团凭借精湛工艺承建。中国工程院院士钱七虎对此...
12:43
2025年8月17日,常州队在‘苏超’赛场取得进球,淹城春秋乐园为庆祝这一体育盛事,特别推出一系列惠民活动回馈市民。即日起至8月22日,镇江市民及全国体育老师可凭有效证件免费入园,共享欢乐时光。为鼓励教育界交流,体育老师还可免费携带一名音乐或美术老师同行,让不同领域的教育工作者共赴文化盛宴。此外,8月17日至8月24日,苏锡常三市市民凭身份证购票可享四折优惠...
12:43
2025年8月16日深夜22时许,内蒙古自治区巴彦淖尔市乌拉特后旗乌盖苏木东乌盖沟上游地区突发严重山洪灾害,一场突如其来的自然浩劫瞬间吞噬了正在野外露营的13名人员,导致他们全部失联。经过紧急救援,截至17日10时,搜救队伍已成功救出1名幸存者,但令人痛心的是,已有8人不幸遇难,仍有4人下落不明。目前,相关部门已启动最高级别应急响应,搜救工作正在全速展开,每...