上个月,人工智能领域掀起了一场激烈的”动物战争”,两大开源大模型家族——Meta的Llama(美洲驼)与NEC的日语版ChatGPT,以及Falcon(猎鹰)系列,展开了一场前所未有的技术对决。NEC在深入研究Llama论文和源代码后,迅速推出了日语版ChatGPT,为日本解决了AI技术瓶颈问题;而Falcon-40B在5月问世时力压Llama登顶开源LLM排行榜,这个由Hugging Face制作的榜单成为衡量大模型能力的标尺。排行榜上Llama与Falcon轮流登顶的景象持续不断,Llama 2推出后扳回一城,但9月初Falcon 180B的问世再次刷新了排名纪录,以68.74分的成绩力压Llama 2。有趣的是,Falcon的开发者并非传统科技公司,而是阿联酋科技创新研究所。政府人士曾表示:”我们参与这场竞赛是为了颠覆核心玩家”。180B版本发布次日,阿联酋人工智能部长奥马尔就入选《时代周刊》AI领域最具影响力的100人名单,与”AI教父”辛顿、OpenAI的阿尔特曼以及李彦宏等一同上榜。

如今AI领域已进入”群魔乱舞”的群雄逐鹿时代,全球各国纷纷推出”XX国版ChatGPT”计划。仅在海湾地区,沙特阿拉伯8月就为国内大学采购了3000多块H100芯片用于LLM训练。金沙江创投朱啸虎曾感慨:”当年看不起互联网商业模式创新,没想到硬科技大模型创业也变成了百模大战”。这场看似高难度的技术竞赛,为何会演变成各国纷纷推出类似产品的局面?

这一切都要归功于2017年谷歌八位计算机科学家发表的《Attention Is All You Need》论文。这篇被引次数第三高的论文公开了Transformer算法,点燃了本轮AI热潮。无论是GPT系列还是其他轰动世界的大模型,都站在了Transformer的肩膀上。在Transformer出现之前,”教机器读书”一直是公认的学术难题。人类阅读时不仅关注当前词句,更会结合上下文理解,但早期的神经网络输入彼此独立,无法理解长文本。直到2014年,伊利亚·苏茨凯弗使用循环神经网络(RNN)处理自然语言,使谷歌翻译性能大幅提升。RNN通过”循环设计”,让每个神经元既接受当前输入也接受上一时刻信息,从而具备结合上下文的能力。

然而RNN存在严重缺陷——顺序计算导致运行效率低下,难以处理大量参数。2015年,Noam Shazeer与同伴开始开发RNN替代品,最终诞生了Transformer。Transformer的两大变革:一是用位置编码取代循环设计实现并行计算,大幅提升训练效率;二是进一步加强上下文理解能力。Transformer的出现彻底改变了AI领域,将大模型从理论研究问题变成了工程问题。2019年OpenAI基于Transformer开发的GPT-2惊艳学术界,谷歌迅速推出性能更强的Meena,仅通过堆叠8.5倍训练参数和14倍算力就超越了GPT-2。Transformer问世后,学术界算法创新速度明显放缓,数据工程、算力规模和模型架构成为AI竞赛的关键。

计算机科学家吴恩达在斯坦福大学演讲时指出:”AI是一系列工具的集合,与电力和互联网等通用技术类似。”OpenAI虽仍是LLM风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力源自工程解决方案,若开源任何竞争对手都能迅速复现。预计未来其他大型科技公司也能打造出同等性能的大模型。

“百模大战”已从修辞手法变为现实。截至今年7月,中国大模型数量达130个,超过美国的114个,实现弯道超车。除中日阿联酋外,印度Bhashini、韩国HyperClova X等也推出了国家级大模型。这场AI竞赛仿佛重现了互联网泡沫时代的”钞能力”对轰。Transformer将大模型变成工程问题,但入场券虽易得,成为AI时代BAT却非易事。

“动物战争”中Falcon虽排名力压Llama,却未对Meta造成实质性冲击。Meta开源Llama系列既分享科技福祉,又调动开发者智慧。早在2015年组建AI实验室时,Meta就确立了开源基调。扎克伯格深谙社交媒体的群众关系之道,近期推出”AI版创作者激励”活动,资助使用Llama 2解决社会问题的开发者。截至10月初,Hugging Face开源LLM排行榜Top 10中8个基于Llama 2,仅Hugging Face上使用Llama 2协议的LLM就超过1500个。排名第一的LLM仍基于Llama 2打造,而Falcon等模型与GPT-4仍存在明显性能差距。

AgentBench测试显示,GPT-4以4.41分问鼎榜首,Claude仅2.77分,开源LLM多在1分左右徘徊。造成这种差距的不仅是参数,更是OpenAI科学家团队的科研实力和长期积累。大模型的核心能力在于生态建设(开源)或纯粹推理能力(闭源)。随着开源社区活跃,各模型性能可能趋同,因为大家都在使用相似架构和数据集。

更严峻的挑战是价值锚点的缺失。除了Midjourney等少数案例,大部分软件公司尚未想清楚如何盈利。微软的GitHub Copilot每月亏损20美元,重度用户甚至让微软每月倒贴80美元;Adobe也推出积分系统防止用户过度使用。微软和Adobe这些软件巨头都步履维艰,更不用说其他单纯堆砌参数的大模型供应商。没有OpenAI和ChatGPT的横空出世,这场AI革命或许根本不会发生;但在当下,训练大模型的价值值得商榷。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商空间将更小。iPhone 4的火爆不是因为45nm制程的A4处理器,而是因为它能玩植物大战僵尸和愤怒的小鸟。大模型需要找到类似的应用场景,才能真正实现商业化落地。

最新快讯

2025年12月21日

12:52
截至12月21日11时,全国多省因恶劣天气实施交通管制,安徽、湖北、河南、甘肃、新疆、黑龙江、青海7省(区)国省干线共有25个路段采取封闭管控措施。其中,4个路段完全封闭主线,21个路段关闭收费站,确保行车安全。交通运输部路网中心特别提醒,相关地区已启动应急预案,通过主动管控手段降低安全风险。由于天气状况复杂多变,具体路段的恢复通行时间将根据实时气象数据另行...
12:52
2025年12月18日,独立游戏界迎来重大震动。知名独立游戏大奖Six One Indie主办方突然宣布,撤销《光与影:33号远征队》及其开发商Sandfall Interactive所获得的年度最佳游戏与最佳出道作两项大奖。这一决定引发广泛关注,其背后原因直指生成式人工智能技术的使用违规。 据悉,该游戏在参评阶段曾向评委郑重承诺,开发过程中未使用任何人...
12:21
2025年12月12日,知名游戏制作人小岛秀夫在一场备受瞩目的采访中,首次深入分享了其全新力作《死亡搁浅 2:冥滩之上》的创作理念与心路历程。这位享誉全球的游戏设计大师透露,本作刻意在剧情中注入违和感与摩擦感,旨在营造一种独特的沉浸式体验,让玩家在游戏结束后仍能久久回味,如同品尝一道难以消化的美食,需要反复咀嚼才能体会其深层韵味。这种独特的叙事手法,正是小岛...
12:21
2025年12月20日傍晚,美国加利福尼亚州旧金山市遭遇了一场突如其来的大规模停电事故,整个城市陷入一片黑暗。据太平洋天然气和电力公司最新通报,此次停电事件波及范围空前,直接影响约13万家庭和商户,这一数字占该公司在旧金山服务客户总数的近三分之一。作为美国西海岸重要的金融科技中心,此次停电对旧金山的商业活动和居民生活造成了显著影响。 太平洋天然气和电力公司紧...
12:21
2024年,重庆市的宠物市场迎来蓬勃发展,犬、猫饲养总量成功突破200万只大关,展现出强大的市场活力。据最新数据显示,整个宠物市场规模正以年均18%的惊人增速扩张,整体规模已超过200亿元,成为城市消费新热点。这一繁荣景象的背后,是完善的产业链体系逐渐成型,涵盖了从宠物繁育、食品加工到智能用品研发、连锁医疗及新零售服务的全链条布局,为宠物爱好者提供了全方位的...
12:21
2025年,中国海上油气勘探开发领域再传捷报,渤海油田年累计生产油气当量成功突破4000万吨大关,这一里程碑不仅刷新了该油田的历史生产记录,更彰显了中国能源工业的卓越成就。作为中国最大的海上油田,渤海油田的此次突破性进展,充分展现了中国海油在深海油气资源勘探开发领域的强大实力和技术创新能力。 渤海油田作为中国重要的海上能源基地,其主产区位于广阔的渤海海域。近...
12:21
12月21日起,我国中东部地区将迎来明显的降水过程,雨雪天气逐渐增多。预计在接下来的两天内,新一轮雨雪天气将正式发展,其中东北地区部分区域将面临较强的降雪,公众需密切关注天气变化,做好防范措施。 与此同时,两股冷空气接连影响我国,导致气温呈现起伏波动。各地居民需根据实时天气情况,适时调整着装,注意保暖防寒。建议外出时携带雨具和防风外套,以应对多变天气。 ...
12:21
"十四五"规划实施以来,我国智慧农业建设进入高速发展期,创新能力实现跨越式提升。国家层面精心布局,在全国范围内建设了34个智慧农业创新中心及其分中心,同时设立30个农业农村部农业信息技术重点实验室,为关键技术研发与成果转化提供坚实支撑。这些举措有力推动了农业科技创新体系的完善,为现代农业发展注入强劲动力。 在技术应用方面,物联网、大数据、人工智能等前沿技术已...
12:21
12月20日,历史性时刻在中国重庆上演。国内首块L3级自动驾驶专用号牌“渝AD0001Z”正式发放,这一标志性事件由重庆市公安局交通管理总队面向长安汽车完成授予,正式宣告我国首款L3级自动驾驶车型迈入合规化运营阶段。作为行业破冰者,长安汽车借此成为全国首家获得L3级自动驾驶官方号牌的企业,不仅率先解锁了智能驾驶新纪元,更在技术商业化道路上树立了重要里程碑。 ...
12:21
2025年12月16日,迪庆藏族自治州香格里拉机场传来喜讯,其货邮吞吐量成功突破1600吨大关,这一亮眼成绩不仅完成了年度预定目标的119.4%,更刷新了该机场自通航以来的历史纪录。这一显著进步的背后,是香格里拉机场在破解高原货源短缺这一长期瓶颈上所做的持续努力,以及不断优化的货运保障体系的显著成效。 香格里拉机场地处高原,地理环境的特殊性曾给货源组织带来诸...
12:21
12月20日,在备受瞩目的「Alpha峰会」上,金山办公助理总裁朱熠锷发表了关于企业AI应用发展趋势的重要观点。他明确指出,当前企业AI应用正经历一场深刻的范式转变——从传统的“以模型为中心”模式,加速迈向“以数据为中心”的新阶段。这一转变的核心逻辑在于,数据质量已不再仅仅是AI应用的辅助要素,而是直接决定了AI应用能否产生实际价值的决定性因素。 朱熠锷强调...
12:21
12月20日,备受瞩目的国家人工智能应用中试基地(医疗)·浙江正式拉开年度成果发布序幕,标志着基地产业园正式投入运营,同时其服务平台也同步面向社会公众开放。这一重要里程碑不仅彰显了基地在推动医疗AI领域发展的坚定决心,更彰显了其作为区域创新引擎的强大实力。 作为国家‘人工智能+’行动计划和‘两重’战略的核心组成部分,该基地落户浙江,承载着打造‘国际一流’‘人...