编者按:本文精选自微信公众号《有新Newin》(ID:NewinData),经微新创想授权转载。近期,知名投资人Stephanie Smith与资深科技记者Guido Appenzeller就当前人工智能创投生态展开深度对话,聚焦AI算力成本与市场可持续性等核心议题。本次对谈内容涵盖LLM训练成本、数据瓶颈、模型规模、训练数据量及硬件演进等多个维度,完整对话实录如下:

Stephanie Smith指出,Guido在最新文章中强调AI计算成本居高不下,并指出计算资源获取已成为AI企业成功的决定性因素。这一趋势不仅适用于构建超大规模模型的头部企业,更普遍的是,许多公司将其80%以上的融资资本投入计算资源。这一现象自然引发了一个关键问题:AI算力投入的可持续性究竟如何?

Guido Appenzeller回应道,早期阶段构建的核心技术需向完整产品形态演进,涉及更多功能验证与实施细节。若面向企业客户,还需处理复杂的行政管理事务,这意味着非AI传统软件开发工作量将显著增加,相应的人力成本也随之提升。他预测,虽然计算成本占比会随时间推移逐渐下降,但绝对金额在短期内仍将持续增长——毕竟当前AI繁荣期尚处于早期阶段。

Stephanie Smith强调,AI发展才刚刚起步。在第二部分讨论中,她指出计算需求短期内难以缩减,而基础设施的自主投资或租赁决策对企业的盈利能力具有决定性影响。此外,批处理规模、学习率及训练周期等参数也会显著影响最终成本构成。

Guido Appenzeller进一步解析,模型训练成本受多重因素影响。好消息是,当前主流模型多采用Transformer架构——这一AI领域的重大突破。相较于传统模型,Transformer架构具有更高的灵活性和并行处理能力,训练效率显著提升。具体而言,Transformer模型的推理时间约等于参数数量的两倍浮点运算,而训练时间则约为参数数量的六倍。以GPT-3为例,该模型拥有1750亿个参数,进行一次推理需约3500亿次浮点运算。这一计算方法可帮助企业评估所需计算能力、成本预测及定价策略,同时也能估算模型训练所需时长及AI加速器的浮点运算能力。

Stephanie Smith以GPT-3为例,直观展示模型训练与推理所需的计算资源。Guido Appenzeller指出,若采用理想化计算方式,基于GPT-3的参数数量与训练数据规模,可得出约3×10^23次浮点运算的需求——这一数字包含23个零,难以直观理解。以A100显卡为例(当前主流计算设备之一),其单秒可执行浮点运算次数已知。通过数据对比,可得出粗略的训练时长估算。考虑到A100租赁成本约1-4美元/小时,初步计算显示训练成本约50万美元。但需注意,该分析未考虑优化措施、内存带宽限制、网络瓶颈及多次测试运行等因素。实际观察显示,当前行业内的LLM训练成本已远超预期,可能达到数百万美元级别。主要原因是计算资源预约周期长,若需在2个月内使用全部显卡,实际成本可能增加12倍,相当于在基础成本上增加一个数量级。

Stephanie Smith补充道,与训练成本相比,推理成本要低得多。对于现代文本模型,训练数据规模约1万亿个token,而推理过程每个单词作为一个token输出,速度约是训练的1万亿倍。这意味着计算一个LLM的推理成本仅增加几分钱到几分之一钱。但需特别指出,推理成本受峰值容量约束影响显著——例如,若模型在周一上午9点达到使用峰值,企业仍需承担周六午夜时的全部费用,这会大幅推高成本。对于特定图像模型,可采用成本更低的显卡进行推理,因为模型规模较小,可在消费级显卡的服务器版本上运行,从而节省大量开支。

Stephanie Smith提出,正如前文所述,单纯堆砌低性能芯片无法弥补训练过程中的低效率。Guido Appenzeller强调,训练过程需要高度复杂的软件支持,因为跨卡数据分配的损耗可能超过硬件性能提升带来的收益。但对于推理而言,情况则截然不同。

Guido Appenzeller解释道,推理过程通常可在单张显卡上完成。以Stable Diffusion这类热门图像生成模型为例,其可在MacBook等消费级设备上运行,前提是设备具备足够的内存和计算能力。这意味着无需使用A100等高端显卡,即可实现成本可控的推理部署。

Stephanie Smith进一步提出,既然模型训练的计算量远超推理,且计算投入通常与模型质量正相关,那么是否意味着资本雄厚的传统企业将主导这场竞赛?Guido Appenzeller坦言,这是一个价值万亿美元级别的问题。他首先指出,训练LLM的高昂成本是阻碍开源LLM发展的重要原因——尽管许多开发者有意愿参与,但获取数百万美元级别的计算资源仍是巨大障碍。不过,他同时认为,随着技术进步,训练成本有望下降。一方面,数据获取可能成为新的瓶颈;另一方面,模型规模与最佳训练数据量存在对应关系。一个LLM若缺乏足够的数据支撑,其价值将大打折扣;反之,若数据量充足但模型规模过小,同样无法发挥应有效能。他比喻道,模型规模与人类知识积累存在某种平衡关系,就像大脑容量与教育年限的对应。当前大型模型已涵盖互联网约10%的内容(包括维基百科、海量书籍等),未来可能存在10倍级增长空间,但100倍级增长则难以实现——毕竟人类知识创造速度有限。因此,他预测训练成本可能达到峰值后趋于平稳,主要得益于硬件性能提升,但数据获取增长将放缓,除非出现新的数据生成方法。基于这一判断,他相信由资本驱动的巨头企业构建的模型,更像是一个加速器而非壁垒,因为资金充足的初创公司完全有能力训练LLM,未来该领域仍将涌现大量创新突破。

最新快讯

2025年08月17日

06:52
财联社8月17日快讯 日本九州岛附近海域近日发生5.7级地震,地震发生时间为8月17日凌晨5时13分,震中位于北纬31.75度、东经131.95度,震源深度仅为10千米,属于浅源地震。目前关于此次地震的具体影响范围尚未有明确数据公布,同时是否可能引发海啸的风险也尚未得到官方评估。此次地震虽然震级不算特别高,但由于震源深度较浅,仍可能对周边地区造成一定影响。...
02:52
8月16日,美国国家飓风中心发布紧急预警,飓风"埃林"已正式升级为五级飓风,其最大持续风速惊人地达到每小时257公里。作为飓风强度等级中的最高级别,五级飓风所蕴含的破坏力堪称自然界的恐怖力量,足以对途经地区造成毁灭性打击。气象专家表示,此次升级后的飓风已具备极强的风眼结构,旋转时速远超普通台风,预计将在未来72小时内继续增强。 目前,美国国家飓风中心已启动最...
00:33
8月17日12时起,琼州海峡客滚运输因受南海热带低压影响而全面停运,预计此次停运将持续至8月18日14时。为保障旅客安全,各港口自17日10时起已暂停售票业务,同时关闭入港通道。相关部门提醒,具体复运时间将根据天气变化情况另行通知。此次停运涉及琼州海峡沿线多个港口,包括海口港、三亚港等主要客滚码头。建议计划出行旅客密切关注最新动态,及时调整行程安排。热带低压...
00:33
2025年8月17日,常州苏超赛场传来振奋人心的消息,主场作战的常州队凭借一粒精彩进球,以1比0力克镇江队,不仅为球队赢得了赛季首场胜利,更一举打破了此前连续9轮未能取胜的尴尬纪录。这场胜利不仅提升了球队的士气,也为赛季的征程注入了新的活力。 同一天,另一则好消息来自溧阳文旅官方抖音账号。天目湖景区宣布,将面向全国姓赵的游客提供免费门票优惠,活动时间从即日起...

2025年08月16日

23:33
香港天文台正式发布重要通知 将于当地时间2025年8月16日晚上10点20分正式发出一号戒备信号 以警示市民高度关注可能对本地造成影响的热带气旋动态。此次提前预警旨在充分保障市民安全 提醒大家及时做好各项防范措施 确保在热带气旋靠近时能够迅速响应 有效降低潜在风险。相关部门呼吁市民密切关注天气变化 保持通讯畅通 并根据预警级别采取相应应对措施。
23:33
2025年8月16日,陆家嘴金融沙龙上,华领医药董事长陈力发表重要演讲,为中国创新药在全球市场的崛起提供了有力佐证。他透露,目前中国制造的创新药已占据全球市场的38%,这一数字充分彰显了中国医药产业的强大竞争力与创新实力。 在创新药研发方面,中国正以惊人的速度追赶并超越国际水平。数据显示,去年全年中国共有39个创新药成功上市,而今年上半年这一数字就已达到30...
23:33
8月16日,央视财经《对话》栏目中,华为常务董事余承东就鸿蒙生态发展发表了重要观点。他明确表示,鸿蒙生态有望在今年年底实现与安卓和iOS生态的全面看齐,这标志着华为在移动操作系统领域迈出了关键性步伐。余承东特别强调了鸿蒙系统的核心优势——一次开发、多端部署的强大能力,这一特性将极大降低开发成本并提升应用效率。 他指出,尽管初期从其他系统迁移到鸿蒙生态存在较大...
22:22
8月16日,四川长虹重磅发布百吋巨幕系列新品,并同步揭晓备受期待的D7H Ultra预发布信息。这款新品严格遵循《百吋电视选购白皮书》标准,旨在为消费者带来极致的视觉盛宴。据悉,该系列产品将于8月20日正式开启预约通道,引发市场高度关注。 根据中国电子商会等权威机构发布的数据显示,百吋大屏电视市场正以超过30%的年增长率迅猛发展,已然成为高端消费领域的新宠。...
22:22
人民财讯8月16日电 在备受瞩目的苏超联赛焦点战中,常州队于8月16日晚场主场以1:0力克镇江队,强势斩获球队在苏超联赛的首场胜利 这场胜利不仅终结了常州队此前8轮不胜且一球未进的尴尬纪录,更极大地提振了球队士气,令广大球迷倍感振奋 比赛在常州队的主场展开激战 常州队凭借出色的战术执行和顽强的拼搏精神,最终以1球小胜对手 这一胜利意义重大,不仅为球队打...
22:22
8月16日21时5分,山东省青州市(北纬36.48度,东经118.33度)发生3.0级地震,震源深度11千米。这一地质活动由中国地震台网正式测定并发布。截至目前,尚未有关于人员伤亡或财产损失的报道。此次地震的震级虽然不高,但仍然提醒我们关注地质安全,加强防震减灾意识。地震作为一种自然现象,虽然无法完全预测和阻止,但通过科学的监测和有效的应急措施,我们可以最大...
22:22
2025年8月16日,国际篮联男篮亚洲杯半决赛的战火在当地时间点燃,中国男篮凭借出色的团队表现和关键球员的出色发挥,以98:84的比分强势击败新西兰队,成功锁定决赛席位。这场胜利不仅展现了中国男篮的竞技实力,更标志着球队时隔10年再次踏上亚洲杯决赛的领奖台,提前实现了赛前的战略目标。 随着比赛进入白热化阶段,中国男篮在攻防两端都展现出了强大的统治力。核心球员...
22:22
猫眼专业版数据显示,电影《南京照相馆》上映23天票房已突破25亿元,这一亮眼成绩再次印证了影片强大的市场号召力。自7月24日登陆全国影院以来,《南京照相馆》凭借其深刻的历史主题和精良的艺术制作,迅速成为暑期档观众热议的焦点。影片以独特的视角和细腻的情感表达,将南京这座城市的历史记忆与个体命运巧妙融合,引发观众强烈共鸣。此次票房突破25亿元,不仅刷新了影片自身...