声明:本文源自微信公众号CSDN(ID:CSDNnews),作者 |The Economist,译者 |明明如月,经微新创想授权转载发布。若AI要实现更卓越的发展,关键在于以更少的资源打造更强大的功能。大型语言模型(LLMs)如OpenAI的GPT(Generative Pre-trained Transformer)——驱动美国流行聊天机器人的核心引擎——其命名恰如其分。这类现代AI系统由庞大的人工神经网络驱动,以宏观方式模拟生物大脑的运作机制。2020年问世的GPT-3堪称LLM领域的“巨无霸”,拥有1750亿个参数,即神经元间模拟连接的总量。该模型通过数周内利用数千个AI计算专用的GPU处理数万亿字文本进行训练,预计耗资高达460万美元。然而,现代AI研究的共识是:“规模越大,性能越强”。因此,模型规模的扩张速度持续飞驰。今年3月发布的GPT-4据估计拥有约1万亿个参数,较前代增长了近六倍。OpenAICEO Sam Altman估算其研发成本已超1亿美元。整个行业均呈现相似趋势。研究公司Epoch AI在2022年预测,训练顶级模型所需的计算能力每6至10个月便会翻倍(如下图所示)。随着AI模型参数规模的持续膨胀,一系列问题随之浮现。若Epoch AI的预测成立,训练成本每10个月翻倍,至2026年可能突破十亿美元——这还是在假设数据资源未先被耗尽的前提下。2022年10月的一项分析预测,用于训练的高质量文本可能在同一时间周期内用尽。即便模型训练完成,运行大型模型的实际成本也可能极为高昂。今年早些时候,摩根士丹利银行估算,若一半的Google搜索由当前GPT类型程序处理,将使公司年支出增加60亿美元。随着模型规模扩大,这一数字或将持续攀升。因此,许多人认为“大即好”的AI模型发展路径已难以为继。要持续提升AI模型性能(更不用说实现宏伟的AI愿景),开发者必须探索如何在有限资源下获得更优表现。正如Altman先生今年4月回顾大型AI发展历程时所言:“我认为我们已经进入了一个时代的终结。”

量化紧缩

与此同时,研究人员开始转向如何提升模型效率,而非单纯追求规模扩张。一种策略是通过减少参数数量但增加训练数据量来实现平衡。2022年,Google的DeepMind部门在一个包含1.4万亿字语料库上训练了拥有700亿参数的LLM——Chinchilla。尽管参数量远少于GPT-3的1750亿,训练数据也只有3000亿字,但该模型表现却超越GPT-3。为小型LLM提供更多数据意味着训练时间延长,但最终成果是更小、更快、更经济的模型。

另一种选择是降低浮点数精度。减少模型中每个数字的精确位数(即四舍五入),能显著降低硬件需求。奥地利科学技术研究所的研究人员在3月份证明,四舍五入可大幅削减类似GPT-3模型的内存消耗,使其仅需一台高端GPU即可运行,且“精度损失可忽略不计”。

部分用户会对通用LLM进行微调,专注于特定任务如生成法律文件或检测假新闻。虽然不如首次训练LLM复杂,但微调过程仍可能成本高昂且耗时。微调Meta开源的650亿参数LLaMA模型,需多台GPU支持,耗时从数小时到数天不等。华盛顿大学研究人员发明了一种更高效方法,能在单GPU上一天内从LLaMA创建新模型Guanaco,性能损失微乎其微。其中关键技巧包括采用类似奥地利的四舍五入技术,并运用“低秩自适应(Low-Rank Adaptation,LoRA)”技术——该技术固定模型现有参数,再添加一组新的小参数进行微调。这使得即便是计算能力较弱的设备如智能手机也能胜任微调任务。

若能让LLM在用户终端而非巨型数据中心运行,将实现更个性化体验和更好的隐私保护。同时,Google团队为小型模型用户提供了新方案。该方法从大型通用模型中提取特定知识,转化为更小且专业的模型。大模型充当“教师”,小模型扮演“学生”。研究人员让教师回答问题并展示推理过程,将教师答案与推理过程用于训练学生模型。该团队成功训练出仅含77亿参数的学生模型,在特定推理任务上超越拥有5400亿参数的教师模型。

另一种策略是改变模型构建方式,而非关注模型功能本身。多数AI模型采用Python开发,其设计易于使用但屏蔽了运行时芯片操作细节,导致代码运行效率降低。关注这些实现细节能带来巨大收益。正如开源AI公司Hugging Face首席科学官Thomas Wolf所言,这是“当前AI领域的重要研究方向”。

优化代码

例如,2022年斯坦福大学发布了一种改进版“注意力算法”,使LLM能更高效学习词语与概念间的联系。该算法通过修改代码,考虑芯片运行时状态,特别是何时检索或存储特定信息,成功将GPT-2训练速度提升三倍,并增强其处理长查询的能力。

更简洁的代码也可借助先进工具实现。今年早些时候,Meta发布的新版AI编程框架PyTorch,通过让程序员关注实际芯片上的计算组织方式,仅添加一行代码即可将模型训练速度提升一倍。由前Apple和Google工程师创立的初创公司Modular推出的新AI编程语言Mojo(基于Python),允许程序员掌控被Python屏蔽的所有细节,在某些场景下,Mojo代码运行速度比等价Python代码快数千倍。

最后,改进运行代码的芯片至关重要。虽然最初为处理现代游戏图形而设计,GPU意外在AI模型运行上表现优异。但Meta一位硬件研究员指出,GPU在“推理”(模型训练完成后的实际运行)阶段设计并不完美。因此,多家公司正开发专用硬件。Google已在其内部“TPU”芯片上运行大部分AI项目,Meta及其MTIA芯片、Amazon及其Inferentia芯片均在类似方向探索。

有时仅需简单调整(如四舍五入或切换编程语言)就能实现显著性能提升,这或许令人惊讶。但这也反映了LLM发展速度之快。多年来,LLM主要作为研究项目,重点在于使其能正常运行并产生有效结果,而非过度追求设计优雅性。直到最近,它们才成为商业化、面向大众市场的产品。多数专家认为,改进空间仍巨大。正如斯坦福大学计算机科学家Chris Manning所言:“没有任何理由相信当前神经架构已最优,未来可能出现更先进架构。”

最新快讯

2026年01月23日

10:43
2026年1月23日,备受期待的《影之刃零》项目迎来重大调整。北京灵游坊创始人梁其伟正式宣布,原计划于2026年春节期间发布的实机演示将取消。这一决策背后,是团队对游戏品质的极致追求。通过集中研发力量,团队将优先完成游戏的收尾工作、整体组装以及关键流程的调试,确保最终产品能够完美呈现其独特魅力。 此举也旨在避免因演示内容可能引发的误解。团队深知,游戏类型一直...
10:43
2026年1月22日晚间,理想汽车正式宣布启动针对部分低效直营门店的评估与关闭流程。这一决策在该公司经历渠道快速扩张(2023年单年新增179家门店)与业绩下滑(2025年交付量下降、Q3首现净亏损约6亿元)的双重背景下显得尤为关键。数据显示,截至2025年底,理想汽车全国零售中心数量已达548家,但官网显示的门店总数为904家,这一差异或源于其“繁星计划”...
10:42
2026年1月23日,国家知识产权局在国新办发布会上公布了一组振奋人心的数据:我国地理标志产品直接年产值已接近1万亿元大关,并成功实现五连增的卓越成就。这一亮眼成绩不仅彰显了我国知识产权保护体系的不断完善,更凸显了地理标志产品在推动区域经济高质量发展中的关键作用。截至2025年底,我国累计认定的地理标志产品数量已达到5066个,这一数字背后是各地特色产业经过...
10:42
2026年1月,坐落于古都西安的医疗科技新锐企业麦克斯韦成功斩获百万元天使轮融资,标志着其在医疗数字化定制领域的探索迈入新阶段。作为一家专注于医疗科技创新的高潜力企业,麦克斯韦依托独特的"西安研发+榆林产业化"双城协同发展模式,将研发力量与产业化基地分别布局于科技创新策源地与资源转化枢纽,核心聚焦于智能化仿真假体及仿生医疗器械的研发与应用,致力于为医疗行业带...
10:42
2026年1月,呼吸医疗领域的领军企业哈维生物医疗传来振奋人心的消息,成功斩获数千万元人民币Pre-A轮融资。此次资本运作由如山资本旗下专注于科技创新的星链智投基金强势领投,彰显了资本市场对哈维生物医疗创新实力的高度认可。 作为国内呼吸医疗设备制造的佼佼者,哈维生物医疗始终致力于原创技术的研发与应用。本轮融资所获资金将全面赋能企业核心竞争力的提升,重点投...
10:42
2025年全年,我国知识产权使用费进出口总额突破3800亿元大关,达到3828.7亿元,同比增长7.4%,展现出稳健的增长态势。这一成绩不仅体现了知识产权作为新型生产要素的价值提升,更彰显了我国服务贸易结构的持续优化。特别是在出口端,知识产权使用费增速高达23.1%,成为推动服务贸易出口提质升级的重要引擎,为经济高质量发展注入强劲动力。 在知识产权运营方面,...
10:42
2026年1月23日,国家知识产权局在国务院新闻发布会上发布了我国知识产权领域的最新发展成果。数据显示,截至2025年底,我国国内有效注册商标总量已突破4987.7万件,这一数字不仅彰显了我国商标市场的蓬勃发展,也反映了创新主体对品牌建设的日益重视。全年新增注册商标420.6万件,审查周期稳定控制在4个月以内,这一高效透明的审查机制有效保障了商标申请的及时性...
10:42
2026年1月,广州正则量子科技有限公司成功斩获Pre-A轮数千万级融资,标志着其在量子科技领域的创新之路迈入新阶段。作为光量子计算全栈技术的领军企业,正则量子科技致力于突破硬件、软件与算法的协同瓶颈,构建完整的量子计算技术生态。此次融资将全面赋能其核心研发能力,重点投向光量子器件的迭代升级、专用计算设备的规模化量产以及产业化基地的战略布局。同时,公司将积极...
10:42
2026年1月21日,中船广船国际为韩国HMM公司精心打造的10800车LNG双燃料汽车运输船首艘订单正式顺利出坞,这一里程碑事件标志着中国船舶制造业在高端清洁能源领域取得重大突破。该船舶总长230米,型宽40米,设计科学合理,采用先进的LNG/燃油双燃料动力系统,全面满足国际海事组织TierⅢ严格的排放标准,彰显了我国在环保航运技术上的领先地位。单船最大载...
10:42
2025年,特斯拉在加州的新车注册市场份额遭遇显著下滑,降至9.9%,较2024年锐减1.7个百分点,成为该州跌幅最为突出的汽车品牌。这一数据由加州新车经销商协会于1月22日发布,并基于Experian的权威统计。特斯拉在加州的销量从近20.3万辆大幅跌至不足18万辆,直接导致全州零排放车辆注册量同比减少约7300辆,凸显了市场变化的严峻性。 造成这一现象的...
10:23
随着人工智能大模型对算力需求的持续攀升,数据中心的高能耗与环境影响正成为社会关注的焦点议题。据AIbase最新报道,为缓解公众对公用事业费用上涨的担忧,OpenAI近日正式宣布一项重大承诺:其所有数据中心将全面承担自身产生的能源成本,同时采取严格措施控制水资源消耗。长期以来,大型AI项目因可能推高当地居民电费并消耗大量冷却用水而备受舆论争议。对此,OpenA...
10:23
近日有消息称,vivo 宣布终止其秘密筹备近半年的 AI 眼镜项目,这一决策引发了业界广泛关注。据悉,该项目此前已与歌尔、中科创达等多家 ODM 厂商展开深度合作,共同研发原型机(demo),但目前所有合作已暂停。vivo 执行副总裁胡柏山及多位高层在综合评估后,认为当前 AI 眼镜产品在技术层面与用户体验上难以形成显著差异化,因此作出终止决策。 针对这一市...