声明:本文源自微信公众号CSDN(ID:CSDNnews),作者 |The Economist,译者 |明明如月,经微新创想授权转载发布。若AI要实现更卓越的发展,关键在于以更少的资源打造更强大的功能。大型语言模型(LLMs)如OpenAI的GPT(Generative Pre-trained Transformer)——驱动美国流行聊天机器人的核心引擎——其命名恰如其分。这类现代AI系统由庞大的人工神经网络驱动,以宏观方式模拟生物大脑的运作机制。2020年问世的GPT-3堪称LLM领域的“巨无霸”,拥有1750亿个参数,即神经元间模拟连接的总量。该模型通过数周内利用数千个AI计算专用的GPU处理数万亿字文本进行训练,预计耗资高达460万美元。然而,现代AI研究的共识是:“规模越大,性能越强”。因此,模型规模的扩张速度持续飞驰。今年3月发布的GPT-4据估计拥有约1万亿个参数,较前代增长了近六倍。OpenAICEO Sam Altman估算其研发成本已超1亿美元。整个行业均呈现相似趋势。研究公司Epoch AI在2022年预测,训练顶级模型所需的计算能力每6至10个月便会翻倍(如下图所示)。随着AI模型参数规模的持续膨胀,一系列问题随之浮现。若Epoch AI的预测成立,训练成本每10个月翻倍,至2026年可能突破十亿美元——这还是在假设数据资源未先被耗尽的前提下。2022年10月的一项分析预测,用于训练的高质量文本可能在同一时间周期内用尽。即便模型训练完成,运行大型模型的实际成本也可能极为高昂。今年早些时候,摩根士丹利银行估算,若一半的Google搜索由当前GPT类型程序处理,将使公司年支出增加60亿美元。随着模型规模扩大,这一数字或将持续攀升。因此,许多人认为“大即好”的AI模型发展路径已难以为继。要持续提升AI模型性能(更不用说实现宏伟的AI愿景),开发者必须探索如何在有限资源下获得更优表现。正如Altman先生今年4月回顾大型AI发展历程时所言:“我认为我们已经进入了一个时代的终结。”

量化紧缩

与此同时,研究人员开始转向如何提升模型效率,而非单纯追求规模扩张。一种策略是通过减少参数数量但增加训练数据量来实现平衡。2022年,Google的DeepMind部门在一个包含1.4万亿字语料库上训练了拥有700亿参数的LLM——Chinchilla。尽管参数量远少于GPT-3的1750亿,训练数据也只有3000亿字,但该模型表现却超越GPT-3。为小型LLM提供更多数据意味着训练时间延长,但最终成果是更小、更快、更经济的模型。

另一种选择是降低浮点数精度。减少模型中每个数字的精确位数(即四舍五入),能显著降低硬件需求。奥地利科学技术研究所的研究人员在3月份证明,四舍五入可大幅削减类似GPT-3模型的内存消耗,使其仅需一台高端GPU即可运行,且“精度损失可忽略不计”。

部分用户会对通用LLM进行微调,专注于特定任务如生成法律文件或检测假新闻。虽然不如首次训练LLM复杂,但微调过程仍可能成本高昂且耗时。微调Meta开源的650亿参数LLaMA模型,需多台GPU支持,耗时从数小时到数天不等。华盛顿大学研究人员发明了一种更高效方法,能在单GPU上一天内从LLaMA创建新模型Guanaco,性能损失微乎其微。其中关键技巧包括采用类似奥地利的四舍五入技术,并运用“低秩自适应(Low-Rank Adaptation,LoRA)”技术——该技术固定模型现有参数,再添加一组新的小参数进行微调。这使得即便是计算能力较弱的设备如智能手机也能胜任微调任务。

若能让LLM在用户终端而非巨型数据中心运行,将实现更个性化体验和更好的隐私保护。同时,Google团队为小型模型用户提供了新方案。该方法从大型通用模型中提取特定知识,转化为更小且专业的模型。大模型充当“教师”,小模型扮演“学生”。研究人员让教师回答问题并展示推理过程,将教师答案与推理过程用于训练学生模型。该团队成功训练出仅含77亿参数的学生模型,在特定推理任务上超越拥有5400亿参数的教师模型。

另一种策略是改变模型构建方式,而非关注模型功能本身。多数AI模型采用Python开发,其设计易于使用但屏蔽了运行时芯片操作细节,导致代码运行效率降低。关注这些实现细节能带来巨大收益。正如开源AI公司Hugging Face首席科学官Thomas Wolf所言,这是“当前AI领域的重要研究方向”。

优化代码

例如,2022年斯坦福大学发布了一种改进版“注意力算法”,使LLM能更高效学习词语与概念间的联系。该算法通过修改代码,考虑芯片运行时状态,特别是何时检索或存储特定信息,成功将GPT-2训练速度提升三倍,并增强其处理长查询的能力。

更简洁的代码也可借助先进工具实现。今年早些时候,Meta发布的新版AI编程框架PyTorch,通过让程序员关注实际芯片上的计算组织方式,仅添加一行代码即可将模型训练速度提升一倍。由前Apple和Google工程师创立的初创公司Modular推出的新AI编程语言Mojo(基于Python),允许程序员掌控被Python屏蔽的所有细节,在某些场景下,Mojo代码运行速度比等价Python代码快数千倍。

最后,改进运行代码的芯片至关重要。虽然最初为处理现代游戏图形而设计,GPU意外在AI模型运行上表现优异。但Meta一位硬件研究员指出,GPU在“推理”(模型训练完成后的实际运行)阶段设计并不完美。因此,多家公司正开发专用硬件。Google已在其内部“TPU”芯片上运行大部分AI项目,Meta及其MTIA芯片、Amazon及其Inferentia芯片均在类似方向探索。

有时仅需简单调整(如四舍五入或切换编程语言)就能实现显著性能提升,这或许令人惊讶。但这也反映了LLM发展速度之快。多年来,LLM主要作为研究项目,重点在于使其能正常运行并产生有效结果,而非过度追求设计优雅性。直到最近,它们才成为商业化、面向大众市场的产品。多数专家认为,改进空间仍巨大。正如斯坦福大学计算机科学家Chris Manning所言:“没有任何理由相信当前神经架构已最优,未来可能出现更先进架构。”

最新快讯

2026年02月23日

03:01
微新创想:当地时间2月22日23时57分,印尼北加里曼丹省塔纳提东县西北方向329公里处发生了一次7.0级地震。此次地震的震源深度达到了628公里,属于典型的深源地震。由于震源位于地下较深的位置,地震释放的能量大多被地幔吸收,因此地表震动相对较弱,未引发海啸预警。 印尼气象、气候和地球物理局已经对此次地震发布了正式通报。目前根据初步报告,地震并未造成人员伤亡...
01:51
微新创想:2026年2月22日,苹果公司CEO蒂姆·库克公开表示,视觉人工智能将成为苹果下一阶段的关键技术突破。该表态发生于苹果年度开发者大会筹备期间,地点为美国加州库比蒂诺总部。 库克未透露具体产品或发布时间,但强调其将深度整合至iOS生态与硬件协同中。此举旨在强化设备端图像识别、实时场景理解及隐私优先的AI处理能力,以应对行业在生成式AI与多模态交互领域...

2026年02月22日

22:57
微新创想:三星定于2月25日太平洋时间上午10点举行Galaxy Unpacked全球发布会 三星正式宣布将在2月25日太平洋时间上午10点举行Galaxy Unpacked全球发布会 此次发布会将正式推出Galaxy Buds4 Pro等全新产品 这是三星首次公开确认将在Galaxy Unpacked活动中发布新款Buds系列耳机 新耳机在外观设计上采用了...
22:57
微新创想:2025年第四季度,全球聚氨酯巨头亨斯迈营收达到13.55亿美元,但净亏损为9600万美元。调整后EBITDA为3500万美元。公司指出,亏损主要来源于聚氨酯与先进材料事业部的收入下滑。其中,聚氨酯事业部受到MDI平均售价下降的影响,而先进材料事业部则因基础设施及通用工业领域的需求疲软导致销量减少。亨斯迈表示,尽管销量有所回升,但价格压力仍然显著。...
22:57
微新创想:2026年2月22日,英国零售商Loaded官网短暂显示《侠盗猎车手6》Xbox版标价89.99英镑(约839.6元人民币),引发市场对定价的广泛猜测。这一价格信息迅速在网络上流传,成为玩家和行业观察者热议的焦点。 据悉,《侠盗猎车手6》游戏定于2026年11月19日登陆PS5和Xbox Series X|S平台,而PC版则延后一年推出。这一发布计...
22:57
微新创想:苹果将在2026年3月2日至4日以新闻稿和视频形式向全球发布多款新品。这次发布会不同于以往的传统模式,采用了全新的发布方式。3月4日晚上22时,苹果将在上海举办一场线下体验活动,让粉丝近距离感受新品的魅力。 据内部消息透露,此次苹果将推出至少五款全新产品。其中包括一款全新低配版MacBook,其配色已经在邀请函中有所展示。此外,M5 Pro和M5 ...
22:12
微新创想:2026年2月,Epic Games正式宣布收购德国初创企业Meshcapade。该公司源自著名的马克斯·普朗克智能系统研究所,专注于基于SMPL人体模型的AI驱动3D数字人建模技术。此次收购不仅标志着Epic Games在人工智能与数字内容创作领域的进一步拓展,也预示着其在推动虚拟制作技术发展上的重要布局。 收购完成后,Epic Games将在M...
22:12
微新创想:2026年2月22日22:04,全球首部生肖主题纪录大片《马到功成》将在央视纪录频道CCTV-9【纪录影院】首播 该片由中央广播电视总台领衔出品,马克·布朗罗执导,于适配音,历时三年跨越六大洲拍摄 以蒙古少女珠拉与爱马“兔来”的成长为主线,立体呈现六国八匹代表性骏马的生命故事 影片采用巨幕格式制作,融合国际影像语言诠释马的特质与中华生肖文化 系总台...
22:12
微新创想:2026年2月18日Let's Encrypt宣布在测试环境上线新型ACME验证类型DNS-PERSIST-01 这一新机制基于IETF草案设计旨在提升域名验证的效率和稳定性 通过在_validation-persist.下设置持久化TXT记录的方式实现对指定ACME账户的授权 该机制允许CA在签发或续期证书时无需频繁更新_acme-challen...
21:37
微新创想:2025年12月31日至2026年1月1日,NASA与马里兰大学团队在南极威德尔海展开了一次重要的科学考察活动。此次行动不仅具有科研价值,也标志着人类在探索宇宙生命奥秘的道路上迈出了新的一步。 在元旦当天,科考团队成功在3675英尺(约1120米)的深度采集到了海水样本。这一深度刷新了该科考船此前的取样记录,成为其在深海探索中的一项重要成就。采集的...
21:37
微新创想:2026年2月22日,据最新调研显示,约70%的养宠人愿意携带宠物出行。这一数据反映出宠物在人们生活中的重要地位,也预示着携宠旅游市场正在迅速扩大。越来越多的宠物主人希望在旅行中与爱宠一同享受美好时光,从而催生了对宠物友好型旅游服务的强烈需求。 随着‘携宠出游’热潮兴起,旅游业开始重视这一新兴消费群体。全国工商联旅游业商会景区分会于2025年发布《...
21:37
微新创想:2026年2月22日19时47分,电影《镖人:风起大漠》票房达到6.89677亿元(含预售),成为中国影史票房最高的武侠片。这一成绩不仅展现了影片的市场号召力,也标志着国产新派武侠题材在观众心中的认可度大幅提升。 该片于2月17日大年初一在全国正式上映,由知名导演袁和平执导,吴京、谢霆锋、于适等实力派演员主演。影片以广袤的大漠为背景,构建了一个充满...