编者按:本文精选自微信公众号《有新Newin》(ID:NewinData),经微新创想授权转载。近期,知名投资人Stephanie Smith与资深科技记者Guido Appenzeller就当前人工智能创投生态展开深度对话,聚焦AI算力成本与市场可持续性等核心议题。本次对谈内容涵盖LLM训练成本、数据瓶颈、模型规模、训练数据量及硬件演进等多个维度,完整对话实录如下:

Stephanie Smith指出,Guido在最新文章中强调AI计算成本居高不下,并指出计算资源获取已成为AI企业成功的决定性因素。这一趋势不仅适用于构建超大规模模型的头部企业,更普遍的是,许多公司将其80%以上的融资资本投入计算资源。这一现象自然引发了一个关键问题:AI算力投入的可持续性究竟如何?

Guido Appenzeller回应道,早期阶段构建的核心技术需向完整产品形态演进,涉及更多功能验证与实施细节。若面向企业客户,还需处理复杂的行政管理事务,这意味着非AI传统软件开发工作量将显著增加,相应的人力成本也随之提升。他预测,虽然计算成本占比会随时间推移逐渐下降,但绝对金额在短期内仍将持续增长——毕竟当前AI繁荣期尚处于早期阶段。

Stephanie Smith强调,AI发展才刚刚起步。在第二部分讨论中,她指出计算需求短期内难以缩减,而基础设施的自主投资或租赁决策对企业的盈利能力具有决定性影响。此外,批处理规模、学习率及训练周期等参数也会显著影响最终成本构成。

Guido Appenzeller进一步解析,模型训练成本受多重因素影响。好消息是,当前主流模型多采用Transformer架构——这一AI领域的重大突破。相较于传统模型,Transformer架构具有更高的灵活性和并行处理能力,训练效率显著提升。具体而言,Transformer模型的推理时间约等于参数数量的两倍浮点运算,而训练时间则约为参数数量的六倍。以GPT-3为例,该模型拥有1750亿个参数,进行一次推理需约3500亿次浮点运算。这一计算方法可帮助企业评估所需计算能力、成本预测及定价策略,同时也能估算模型训练所需时长及AI加速器的浮点运算能力。

Stephanie Smith以GPT-3为例,直观展示模型训练与推理所需的计算资源。Guido Appenzeller指出,若采用理想化计算方式,基于GPT-3的参数数量与训练数据规模,可得出约3×10^23次浮点运算的需求——这一数字包含23个零,难以直观理解。以A100显卡为例(当前主流计算设备之一),其单秒可执行浮点运算次数已知。通过数据对比,可得出粗略的训练时长估算。考虑到A100租赁成本约1-4美元/小时,初步计算显示训练成本约50万美元。但需注意,该分析未考虑优化措施、内存带宽限制、网络瓶颈及多次测试运行等因素。实际观察显示,当前行业内的LLM训练成本已远超预期,可能达到数百万美元级别。主要原因是计算资源预约周期长,若需在2个月内使用全部显卡,实际成本可能增加12倍,相当于在基础成本上增加一个数量级。

Stephanie Smith补充道,与训练成本相比,推理成本要低得多。对于现代文本模型,训练数据规模约1万亿个token,而推理过程每个单词作为一个token输出,速度约是训练的1万亿倍。这意味着计算一个LLM的推理成本仅增加几分钱到几分之一钱。但需特别指出,推理成本受峰值容量约束影响显著——例如,若模型在周一上午9点达到使用峰值,企业仍需承担周六午夜时的全部费用,这会大幅推高成本。对于特定图像模型,可采用成本更低的显卡进行推理,因为模型规模较小,可在消费级显卡的服务器版本上运行,从而节省大量开支。

Stephanie Smith提出,正如前文所述,单纯堆砌低性能芯片无法弥补训练过程中的低效率。Guido Appenzeller强调,训练过程需要高度复杂的软件支持,因为跨卡数据分配的损耗可能超过硬件性能提升带来的收益。但对于推理而言,情况则截然不同。

Guido Appenzeller解释道,推理过程通常可在单张显卡上完成。以Stable Diffusion这类热门图像生成模型为例,其可在MacBook等消费级设备上运行,前提是设备具备足够的内存和计算能力。这意味着无需使用A100等高端显卡,即可实现成本可控的推理部署。

Stephanie Smith进一步提出,既然模型训练的计算量远超推理,且计算投入通常与模型质量正相关,那么是否意味着资本雄厚的传统企业将主导这场竞赛?Guido Appenzeller坦言,这是一个价值万亿美元级别的问题。他首先指出,训练LLM的高昂成本是阻碍开源LLM发展的重要原因——尽管许多开发者有意愿参与,但获取数百万美元级别的计算资源仍是巨大障碍。不过,他同时认为,随着技术进步,训练成本有望下降。一方面,数据获取可能成为新的瓶颈;另一方面,模型规模与最佳训练数据量存在对应关系。一个LLM若缺乏足够的数据支撑,其价值将大打折扣;反之,若数据量充足但模型规模过小,同样无法发挥应有效能。他比喻道,模型规模与人类知识积累存在某种平衡关系,就像大脑容量与教育年限的对应。当前大型模型已涵盖互联网约10%的内容(包括维基百科、海量书籍等),未来可能存在10倍级增长空间,但100倍级增长则难以实现——毕竟人类知识创造速度有限。因此,他预测训练成本可能达到峰值后趋于平稳,主要得益于硬件性能提升,但数据获取增长将放缓,除非出现新的数据生成方法。基于这一判断,他相信由资本驱动的巨头企业构建的模型,更像是一个加速器而非壁垒,因为资金充足的初创公司完全有能力训练LLM,未来该领域仍将涌现大量创新突破。

最新快讯

2026年02月11日

20:58
微新创想:2026年2月17日,PlayStation Plus Extra与Premium会员将可游玩《漫威蜘蛛侠2》《无限试驾:太阳王冠》及《Neva》。这一消息由爆料人billbil-kun提前披露,引发玩家广泛关注。三款游戏均支持PS5平台,其中《Neva》还兼容PS4,确保更多玩家能够体验。索尼计划在2月13日6时举行State of Play发布...
20:58
微新创想:2026年2月11日,Counterpoint Research发布最新《高端电视显示面板成本报告》。报告显示,2026年130英寸UHD LCD模块成本约为116英寸的1.5倍;IJP OLED虽材料成本更低,但因新产线折旧高,综合成本暂无优势;QD-OLED良率提升超预期,但受折旧与SG&A拖累,成本仍比同尺寸WOLED高60%–65%...
20:24
微新创想:2026年2月11日,中国南方航空接收第九架国产C919飞机并正式投入运营,首航执飞广州至西安航线。这标志着南航在国产大飞机运营方面迈出了坚实一步,进一步丰富了其机队结构。 该机将于春运期间每日执行长沙黄花机场至北京大兴机场2个往返航班,分别为CZ3717/CZ3718和CZ3147/CZ6137。这一安排不仅提升了航线的运力,也为旅客提供了更多便...
20:24
微新创想:2026年2月11日 爆料人Evan Blass公布联想moto Edge 70 Fusion官方海报 该机将于近期发布 提供乡村空气 冲浪蓝 运动绿 东方蓝和剪影五种潘通认证配色 手机采用曲面屏设计 后置三摄 搭载骁龙7s Gen 3处理器 最高12GB RAM+256GB存储 内置7000mAh电池 支持68W有线快充 具体上市时间与售价尚未公...
20:24
微新创想:2026年2月,保时捷在瑞典北部和德国偏远地区启动了2028款Panamera的测试工作。此次测试涉及两辆经过伪装的测试车辆,它们均配备了全新的倾斜式格栅设计,进一步强化了前脸的视觉冲击力。同时,新车还采用了更新的Matrix LED灯组,提升了照明效果与辨识度。 微新创想:在安全辅助系统方面,2028款Panamera将搭载与纯电Macan同款的...
20:24
微新创想:2026年2月11日,曜越正式发布新款49英寸曲面带鱼屏显示器TGM-V49CDQ 这款显示器采用了5120×1440的高分辨率设计,为用户带来更加细腻的视觉体验。240Hz的刷新率确保了画面的流畅性,特别适合对帧率要求较高的游戏和视频编辑场景。Fast VA面板不仅提升了色彩表现力,还优化了对比度和视角,让屏幕在不同角度下依然保持出色的显示效果 ...
20:24
微新创想:2026年2月11日,复星集团控股的葡萄牙忠诚保险公司(Fidelidade)正推进首次公开募股(IPO)计划。据知情人士透露,该公司的潜在估值已超过30亿欧元。此次IPO由复星国际主导,预计将在里斯本证券交易所进行,同时也有引入战略投资者的可能性。这一举措被视为复星集团优化其海外保险资产结构的重要一步,有助于提升资本使用效率和增强市场影响力。 目...
20:24
微新创想:2026年2月11日,航旅纵横民航官方直销平台正式上线春运机票“买贵免费退”服务。这一创新举措为旅客提供了更灵活的购票选择,增强了出行的保障性。旅客在该平台购买带有“买贵退”标签的机票后,若在出票24小时内发现同一航班存在更低价格,可购买新票并提交退旧票申请,享受免费退票服务。 该服务覆盖了国航、南航、东航等国内主要航空公司,后续还将逐步拓展至更多...
20:24
微新创想:2026年2月10日,微软在“补丁星期二”更新中修复了Windows记事本应用的高危远程代码执行漏洞(CVE-2026-20841)。该漏洞影响通过Microsoft Store分发的新版记事本,特别是在处理恶意Markdown(.md)文件时,用户点击特制链接即可触发远程代码执行,进而导致系统被完全控制。 漏洞的根本原因在于记事本对命令中特殊字符...
20:24
微新创想:2026年2月11日,游戏科学创始人冯骥就AI生成游戏能力发表评论。他在试用Seedance 2.0后指出,AIGC已结束童年时代,并调侃若AI真能轻松制作《黑神话:悟空》同级作品,团队或将转型为‘新时代非遗手工作坊’。 该回应发生于其个人社交平台,针对网友关于AI冲击高品质单机游戏开发的提问。冯骥强调,当前顶尖游戏仍高度依赖创意、审美与工程深度协...
20:24
微新创想:2026年2月11日,江钨装备(600397.SH)发布公告,计划向特定对象发行不超过2.97亿股A股,募集资金总额不超过18.82亿元。此次发行的目的是通过全资收购江西江钨硬质合金有限公司、赣州华茂钨材料有限公司以及九江有色金属冶炼有限公司,实现对相关企业100%股权的掌控。此举将有助于公司整合钨与钽铌产业链资源,进一步优化产业布局,提升整体竞争...
20:24
微新创想:2026年2月11日,一项国际研究取得重大突破,成功制备出一种能够特异性识别细菌表面伪胺酸分子的合成抗体。伪胺酸是一种独特的糖分子,仅存在于多种致病菌中,对于细菌的生存和致病能力具有关键作用。由于人体内并不存在该分子,因此这种合成抗体展现出极高的靶向性,同时大大降低了对非目标组织的潜在伤害。 微新创想:这项研究的成果为解决抗生素耐药性问题提供了全新...