声明:本文源自微信公众号CSDN(ID:CSDNnews),作者 |The Economist,译者 |明明如月,经微新创想授权转载发布。若AI要实现更卓越的发展,关键在于以更少的资源打造更强大的功能。大型语言模型(LLMs)如OpenAI的GPT(Generative Pre-trained Transformer)——驱动美国流行聊天机器人的核心引擎——其命名恰如其分。这类现代AI系统由庞大的人工神经网络驱动,以宏观方式模拟生物大脑的运作机制。2020年问世的GPT-3堪称LLM领域的“巨无霸”,拥有1750亿个参数,即神经元间模拟连接的总量。该模型通过数周内利用数千个AI计算专用的GPU处理数万亿字文本进行训练,预计耗资高达460万美元。然而,现代AI研究的共识是:“规模越大,性能越强”。因此,模型规模的扩张速度持续飞驰。今年3月发布的GPT-4据估计拥有约1万亿个参数,较前代增长了近六倍。OpenAICEO Sam Altman估算其研发成本已超1亿美元。整个行业均呈现相似趋势。研究公司Epoch AI在2022年预测,训练顶级模型所需的计算能力每6至10个月便会翻倍(如下图所示)。随着AI模型参数规模的持续膨胀,一系列问题随之浮现。若Epoch AI的预测成立,训练成本每10个月翻倍,至2026年可能突破十亿美元——这还是在假设数据资源未先被耗尽的前提下。2022年10月的一项分析预测,用于训练的高质量文本可能在同一时间周期内用尽。即便模型训练完成,运行大型模型的实际成本也可能极为高昂。今年早些时候,摩根士丹利银行估算,若一半的Google搜索由当前GPT类型程序处理,将使公司年支出增加60亿美元。随着模型规模扩大,这一数字或将持续攀升。因此,许多人认为“大即好”的AI模型发展路径已难以为继。要持续提升AI模型性能(更不用说实现宏伟的AI愿景),开发者必须探索如何在有限资源下获得更优表现。正如Altman先生今年4月回顾大型AI发展历程时所言:“我认为我们已经进入了一个时代的终结。”

量化紧缩

与此同时,研究人员开始转向如何提升模型效率,而非单纯追求规模扩张。一种策略是通过减少参数数量但增加训练数据量来实现平衡。2022年,Google的DeepMind部门在一个包含1.4万亿字语料库上训练了拥有700亿参数的LLM——Chinchilla。尽管参数量远少于GPT-3的1750亿,训练数据也只有3000亿字,但该模型表现却超越GPT-3。为小型LLM提供更多数据意味着训练时间延长,但最终成果是更小、更快、更经济的模型。

另一种选择是降低浮点数精度。减少模型中每个数字的精确位数(即四舍五入),能显著降低硬件需求。奥地利科学技术研究所的研究人员在3月份证明,四舍五入可大幅削减类似GPT-3模型的内存消耗,使其仅需一台高端GPU即可运行,且“精度损失可忽略不计”。

部分用户会对通用LLM进行微调,专注于特定任务如生成法律文件或检测假新闻。虽然不如首次训练LLM复杂,但微调过程仍可能成本高昂且耗时。微调Meta开源的650亿参数LLaMA模型,需多台GPU支持,耗时从数小时到数天不等。华盛顿大学研究人员发明了一种更高效方法,能在单GPU上一天内从LLaMA创建新模型Guanaco,性能损失微乎其微。其中关键技巧包括采用类似奥地利的四舍五入技术,并运用“低秩自适应(Low-Rank Adaptation,LoRA)”技术——该技术固定模型现有参数,再添加一组新的小参数进行微调。这使得即便是计算能力较弱的设备如智能手机也能胜任微调任务。

若能让LLM在用户终端而非巨型数据中心运行,将实现更个性化体验和更好的隐私保护。同时,Google团队为小型模型用户提供了新方案。该方法从大型通用模型中提取特定知识,转化为更小且专业的模型。大模型充当“教师”,小模型扮演“学生”。研究人员让教师回答问题并展示推理过程,将教师答案与推理过程用于训练学生模型。该团队成功训练出仅含77亿参数的学生模型,在特定推理任务上超越拥有5400亿参数的教师模型。

另一种策略是改变模型构建方式,而非关注模型功能本身。多数AI模型采用Python开发,其设计易于使用但屏蔽了运行时芯片操作细节,导致代码运行效率降低。关注这些实现细节能带来巨大收益。正如开源AI公司Hugging Face首席科学官Thomas Wolf所言,这是“当前AI领域的重要研究方向”。

优化代码

例如,2022年斯坦福大学发布了一种改进版“注意力算法”,使LLM能更高效学习词语与概念间的联系。该算法通过修改代码,考虑芯片运行时状态,特别是何时检索或存储特定信息,成功将GPT-2训练速度提升三倍,并增强其处理长查询的能力。

更简洁的代码也可借助先进工具实现。今年早些时候,Meta发布的新版AI编程框架PyTorch,通过让程序员关注实际芯片上的计算组织方式,仅添加一行代码即可将模型训练速度提升一倍。由前Apple和Google工程师创立的初创公司Modular推出的新AI编程语言Mojo(基于Python),允许程序员掌控被Python屏蔽的所有细节,在某些场景下,Mojo代码运行速度比等价Python代码快数千倍。

最后,改进运行代码的芯片至关重要。虽然最初为处理现代游戏图形而设计,GPU意外在AI模型运行上表现优异。但Meta一位硬件研究员指出,GPU在“推理”(模型训练完成后的实际运行)阶段设计并不完美。因此,多家公司正开发专用硬件。Google已在其内部“TPU”芯片上运行大部分AI项目,Meta及其MTIA芯片、Amazon及其Inferentia芯片均在类似方向探索。

有时仅需简单调整(如四舍五入或切换编程语言)就能实现显著性能提升,这或许令人惊讶。但这也反映了LLM发展速度之快。多年来,LLM主要作为研究项目,重点在于使其能正常运行并产生有效结果,而非过度追求设计优雅性。直到最近,它们才成为商业化、面向大众市场的产品。多数专家认为,改进空间仍巨大。正如斯坦福大学计算机科学家Chris Manning所言:“没有任何理由相信当前神经架构已最优,未来可能出现更先进架构。”

最新快讯

2026年01月18日

05:51
2026年1月中旬,非洲南部多国遭遇了持续强降雨引发的严重洪灾,这场灾难给当地人民带来了巨大的生命财产损失。莫桑比克、南非和津巴布韦是受灾最严重的国家,其中莫桑比克报告103人死亡,这些遇难者中包括因洪水、雷击以及霍乱等次生灾害导致的死亡。这场持续至今的强降雨灾害已经造成超过20万人受灾,数万间房屋被毁,超过7万公顷的农作物被淹没,农田被洪水吞噬,农业收成受...

2026年01月17日

23:42
2026年1月17日,亚洲U23足球锦标赛1/4决赛的战火在赛场上激烈燃烧。中国U23男足与乌兹别克斯坦队展开了一场势均力敌的较量。经过90分钟的常规时间鏖战,双方球员都展现了极高的竞技水平,但场上比分始终紧咬,最终以0-0的平局进入加时赛。加时赛阶段双方继续展开激烈对抗,但依然未能打破僵局,比赛不得不通过残酷的点球大战来决出胜负。 在紧张刺激的点球对决中,...
23:42
2026年1月12日,一则来自游戏巨头育碧的内部评级消息引发了行业广泛关注。据多家媒体报道,育碧将旗下备受瞩目的《刺客信条:影》和《刺客信条:幻景》正式定位为"4A游戏"。这一评级由制作人Krasimira Yakovlieva亲自宣布,她特别强调,《幻景》作为首款原生支持苹果移动设备的4A游戏,开创了移动端游戏品质的新标杆;而《影》则实现了历史性突破,成为...
23:42
2026年1月17日,安徽芜湖星光璀璨,奇瑞汽车在此盛大举办AI之夜,向全球揭晓了其在人工智能领域的最新突破。当晚,奇瑞重磅发布了涵盖猎鹰智驾、灵犀智舱、飞鱼数智底盘及鲲鹏动力四大核心的AI技术进展,标志着中国汽车品牌在智能化浪潮中迈出了坚实一步。 猎鹰智驾系统迎来重大升级,猎鹰500车型新增城区导航辅助驾驶功能,让城市驾驶更加轻松自如。猎鹰700产品序列全...
23:42
2026年1月17日,科技界迎来重大突破——埃隆·马斯克的xAI公司宣布其为Grok人工智能模型打造的"Colossus 2"超级计算机正式投入运行。这款全球首个吉瓦级训练集群目前已具备1吉瓦的算力,并计划在4月份通过扩容升级至1.5吉瓦。这一尖端设施坐落于美国田纳西州孟菲斯市,占地面积广阔,相当于13个标准足球场大小,内部配备了20万块英伟达H100高性能...
23:41
2026年1月15日公布的最新日本游戏机销量报告揭示了市场格局的微妙变化。任天堂Switch 2凭借强劲势头再度称霸,在该统计周期内(2025年12月29日至2026年1月11日)销量高达313,838台,进一步巩固了其在便携式游戏领域的领导地位。值得注意的是,Switch 2自发布以来累计销量已突破409.79万台,显示出其持续的热销态势。 与此同时,索尼...
23:41
1月16日,中国铁建大桥局在江苏常州成功下线全球最大规格的打桩船启闭油缸,标志着我国超大超长油缸国产化技术取得重大突破。该油缸直径达2米,重量高达402吨,额定推力可达到5000吨,其举重能力相当于3500辆家用轿车的总重量,展现了我国高端装备制造业的强大实力。 作为"铁建大桥桩1"号打桩船的核心部件,该油缸特别配备了全球首创的闭式能量回收系统,通过先进技术...
22:40
2026年1月17日,美光科技宣布拟以18亿美元收购力积电位于中国台湾铜锣的P5晶圆厂设施。此举旨在扩充其存储芯片产能,交易预计于第二季度完成。美光计划分阶段提升该厂区的DRAM产量,并预计在2027年下半年实现显著晶圆产出。同时,双方将就晶圆后段封装与组装展开合作,美光亦将支持力积电的传统DRAM产品业务。
22:40
2026年1月17日,中国航发集团传来振奋人心的消息,其自主研发的"太行7""太行15""太行110"燃气轮机示范项目顺利通过国家能源局组织的评估验收。这一重大突破不仅彰显了中国在高端装备制造领域的强大实力,更标志着我国在燃气轮机全产业链上实现了从跟跑到并跑再到领跑的历史性跨越。 作为中国航空发动机集团的核心项目,此次通过验收的燃气轮机示范项目涵盖了自主研发...
22:40
2026年中央广播电视总台春节联欢晚会于1月17日完成首次彩排。本次春晚以“科技+艺术”为核心,融合智能技术与舞美设计,提升视听体验。彩排中,各类节目与技术创新、视觉效果初步整合,展现全新年味想象。继去年智能机器人表演扭秧歌引发关注后,今年机器人将再次亮相,通过创意编排展示我国科技发展成果。演出旨在以科技范和新颖形式营造新春氛围。
22:40
2026年1月16日,罗永浩在朋友圈证实其微博账号被禁言15天,并称将此“善意解读为保护”。此前,他与西贝董事长贾国龙因预制菜话题公开争执,双方微博账号随后均被禁言。罗永浩表示个人不再回应此事,未来若有重大谣言将由公司发布合规澄清声明。微博CEO王高飞同日发文强调,网络名人不得组织约架论战,应通过媒体采访方式表达争议,以减少网络戾气。
22:07
2026年1月17日,绿联在海外市场发布MagFlow二合一Magsafe充电宝。该产品支持Qi2无线充电,内置20000mAh电池,配备数显屏显示电量与功率。正面磁吸面板最高输出25W,内置小充电板可为TWS耳机充5W电,上盖可调角度便于查看手机。自带USB-C编织线支持100W输出,可为笔记本快充,自充最高达65W。机身含USB-A和USB-C接口,A...