上个月,人工智能领域掀起了一场激烈的”动物战争”,两大开源大模型家族——Meta的Llama(美洲驼)与NEC的日语版ChatGPT,以及Falcon(猎鹰)系列,展开了一场前所未有的技术对决。NEC在深入研究Llama论文和源代码后,迅速推出了日语版ChatGPT,为日本解决了AI技术瓶颈问题;而Falcon-40B在5月问世时力压Llama登顶开源LLM排行榜,这个由Hugging Face制作的榜单成为衡量大模型能力的标尺。排行榜上Llama与Falcon轮流登顶的景象持续不断,Llama 2推出后扳回一城,但9月初Falcon 180B的问世再次刷新了排名纪录,以68.74分的成绩力压Llama 2。有趣的是,Falcon的开发者并非传统科技公司,而是阿联酋科技创新研究所。政府人士曾表示:”我们参与这场竞赛是为了颠覆核心玩家”。180B版本发布次日,阿联酋人工智能部长奥马尔就入选《时代周刊》AI领域最具影响力的100人名单,与”AI教父”辛顿、OpenAI的阿尔特曼以及李彦宏等一同上榜。

如今AI领域已进入”群魔乱舞”的群雄逐鹿时代,全球各国纷纷推出”XX国版ChatGPT”计划。仅在海湾地区,沙特阿拉伯8月就为国内大学采购了3000多块H100芯片用于LLM训练。金沙江创投朱啸虎曾感慨:”当年看不起互联网商业模式创新,没想到硬科技大模型创业也变成了百模大战”。这场看似高难度的技术竞赛,为何会演变成各国纷纷推出类似产品的局面?

这一切都要归功于2017年谷歌八位计算机科学家发表的《Attention Is All You Need》论文。这篇被引次数第三高的论文公开了Transformer算法,点燃了本轮AI热潮。无论是GPT系列还是其他轰动世界的大模型,都站在了Transformer的肩膀上。在Transformer出现之前,”教机器读书”一直是公认的学术难题。人类阅读时不仅关注当前词句,更会结合上下文理解,但早期的神经网络输入彼此独立,无法理解长文本。直到2014年,伊利亚·苏茨凯弗使用循环神经网络(RNN)处理自然语言,使谷歌翻译性能大幅提升。RNN通过”循环设计”,让每个神经元既接受当前输入也接受上一时刻信息,从而具备结合上下文的能力。

然而RNN存在严重缺陷——顺序计算导致运行效率低下,难以处理大量参数。2015年,Noam Shazeer与同伴开始开发RNN替代品,最终诞生了Transformer。Transformer的两大变革:一是用位置编码取代循环设计实现并行计算,大幅提升训练效率;二是进一步加强上下文理解能力。Transformer的出现彻底改变了AI领域,将大模型从理论研究问题变成了工程问题。2019年OpenAI基于Transformer开发的GPT-2惊艳学术界,谷歌迅速推出性能更强的Meena,仅通过堆叠8.5倍训练参数和14倍算力就超越了GPT-2。Transformer问世后,学术界算法创新速度明显放缓,数据工程、算力规模和模型架构成为AI竞赛的关键。

计算机科学家吴恩达在斯坦福大学演讲时指出:”AI是一系列工具的集合,与电力和互联网等通用技术类似。”OpenAI虽仍是LLM风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力源自工程解决方案,若开源任何竞争对手都能迅速复现。预计未来其他大型科技公司也能打造出同等性能的大模型。

“百模大战”已从修辞手法变为现实。截至今年7月,中国大模型数量达130个,超过美国的114个,实现弯道超车。除中日阿联酋外,印度Bhashini、韩国HyperClova X等也推出了国家级大模型。这场AI竞赛仿佛重现了互联网泡沫时代的”钞能力”对轰。Transformer将大模型变成工程问题,但入场券虽易得,成为AI时代BAT却非易事。

“动物战争”中Falcon虽排名力压Llama,却未对Meta造成实质性冲击。Meta开源Llama系列既分享科技福祉,又调动开发者智慧。早在2015年组建AI实验室时,Meta就确立了开源基调。扎克伯格深谙社交媒体的群众关系之道,近期推出”AI版创作者激励”活动,资助使用Llama 2解决社会问题的开发者。截至10月初,Hugging Face开源LLM排行榜Top 10中8个基于Llama 2,仅Hugging Face上使用Llama 2协议的LLM就超过1500个。排名第一的LLM仍基于Llama 2打造,而Falcon等模型与GPT-4仍存在明显性能差距。

AgentBench测试显示,GPT-4以4.41分问鼎榜首,Claude仅2.77分,开源LLM多在1分左右徘徊。造成这种差距的不仅是参数,更是OpenAI科学家团队的科研实力和长期积累。大模型的核心能力在于生态建设(开源)或纯粹推理能力(闭源)。随着开源社区活跃,各模型性能可能趋同,因为大家都在使用相似架构和数据集。

更严峻的挑战是价值锚点的缺失。除了Midjourney等少数案例,大部分软件公司尚未想清楚如何盈利。微软的GitHub Copilot每月亏损20美元,重度用户甚至让微软每月倒贴80美元;Adobe也推出积分系统防止用户过度使用。微软和Adobe这些软件巨头都步履维艰,更不用说其他单纯堆砌参数的大模型供应商。没有OpenAI和ChatGPT的横空出世,这场AI革命或许根本不会发生;但在当下,训练大模型的价值值得商榷。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商空间将更小。iPhone 4的火爆不是因为45nm制程的A4处理器,而是因为它能玩植物大战僵尸和愤怒的小鸟。大模型需要找到类似的应用场景,才能真正实现商业化落地。

最新快讯

2025年11月01日

18:43
长城汽车旗下备受瞩目的坦克SUV品牌正式官宣,旗下旗舰车型全新坦克400将于11月6日震撼上市。此次发布会不仅揭示了新车的具体上市时间,更带来了令人期待的预售价格区间——30.98万元至32.98万元,为消费者带来高品质的越野体验提供了全新的选择。 新车在视觉设计上迎来重大突破,特别新增了"敦煌紫"专属高亮配色,以独特的紫色光泽彰显尊贵与个性,完美融合了传统...
18:43
2025年9月,我国新能源建设迎来显著进展,全国范围内新增建档立卡新能源发电项目(不含户用光伏)总数达到7218个,展现出新能源产业蓬勃发展的良好态势。从项目类型来看,风电项目新增32个,而光伏发电项目则占据绝对主导地位,新增数量高达7184个。在光伏发电项目中,集中式项目有34个,工商业分布式项目则达到了7150个,显示出分布式光伏发电的强劲增长势头。此外...
18:43
2025年11月1日,三峡工程迎来了整体竣工验收五周年这一重要里程碑。五年来,在科学调度与精益运行的双重保障下,这座宏伟的水利工程在防洪减灾、清洁能源生产、航运便利化以及水资源综合利用等多个领域均取得了令人瞩目的成就。据统计,工程累计发电量已突破4230亿千瓦时大关,相当于为长江经济带地区提供了源源不断的绿色动力,有力推动了区域经济的持续繁荣与发展。这一系列...
18:43
路透社10月31日独家报道,全球流媒体巨头Netflix正秘密推进对华纳兄弟探索制片及流媒体资产的收购评估,此举或彻底重塑娱乐产业格局。公司已正式聘请顶级投资银行Moelis & Co.担任独家财务顾问,并已获得监管机构批准,可以全面访问相关财务数据。若交易最终达成,Netflix将一举掌控包括《哈利波特》和《DC漫画》在内的全球顶级知识产权体系,同...
18:43
LG电子最新发布的财务报告揭示了其2025年第三季度的强劲业绩表现。公司合并营收达到21.8737万亿韩元,环比增长5.5%,这一增长成果在复杂的外部环境下尤为显著。尽管美国关税政策调整以及电动汽车补贴政策变动等因素带来挑战,LG电子的家电网商和汽车零部件业务依然展现出突出的市场竞争力,成为推动公司整体业绩的关键动力。 同期,LG电子营业利润表现同样亮眼,环...
18:43
2025年11月1日,金隅冀东在一场重要的机构调研活动中释放出关键信号,明确指出2026年水泥市场需求将整体呈现下行态势。这一判断基于对行业发展趋势的深入分析,并充分考虑了当前宏观经济环境与政策导向。作为“十五五”规划的开局之年,国家战略布局预计将推动重大基建项目实施进度前移,形成阶段性需求支撑。具体而言,传统基建项目与新型基础设施建设、城镇化进程加速以及城...
18:12
埃里克·泽利克曼,这位在人工智能领域享有盛誉的顶尖研究员,在离开马斯克麾下的xAI后,正投身于他全新创办的公司Humans &,并积极筹备高达10亿美元的巨额融资,目前公司估值已达到惊人的40亿美元。这一动向引发了资本市场的广泛关注,投资者们正将目光聚焦于由行业顶尖人才组成的小型创新团队,他们相信下一波人工智能的突破性进展,很可能就孕育于这些“小而精...
18:12
2025年11月1日,美团外卖创新性地推出了“接力送”配送新模式,精准聚焦于解决写字楼高峰时段的配送难题。这一模式的核心在于,在午间和晚间高峰时段,专门组建的配送团队将负责完成楼宇内最后100米的配送任务,从而有效缓解外卖骑手在高峰期所面临的电梯难等、楼栋难进、地址难找等一系列棘手问题。美团外卖已迅速响应,专门组建了产品与运营团队,并豪掷超1亿元资金,用于采...
17:32
2025年OCP全球峰会期间,SK海力士重磅发布了其面向未来的NAND闪存产品战略,正式推出专为人工智能时代量身打造的"AIN Family"产品组合。这一创新系列涵盖三大核心解决方案,旨在为AI应用场景提供全方位的存储支持。 AIN P系列专注于AI推理场景的数据处理效能优化,通过突破性的架构设计,预计将于2026年底向市场提供样品。该产品凭借其卓越的数据...
17:32
零跑汽车重磅官宣,全新A10系列车型即将在即将到来的广州车展上震撼揭幕。这一消息传出之际,零跑汽车正迎来交付量的历史性突破,10月份全系交付量高达70289台,同比增长超过84%,成功迈过月销7万台的大关,展现出强劲的市场势头。零跑汽车CEO朱江明在近期透露,2026年将迎来产品矩阵的全面升级,除现有产品线外,D系列将推出2-3款全新力作,A系列也将同步推出...
17:32
卡内基梅隆大学最新研究成果揭示了一个令人深思的现象:具备强大推理能力的大型语言模型在行为上更倾向于表现出自利倾向。这一发现源自人机交互研究所的一项精心设计的实验,通过模拟"公共物品"经济游戏,研究人员得以观察不同类型AI在资源分配上的决策差异。实验数据显示,非推理型AI在游戏中选择共享资源的概率高达96%,而具备高级推理能力的模型这一比例骤降至惊人的20%。...
16:55
2025年11月1日,蔚来汽车在合肥生产基地迎来历史性时刻——第30万台ES6车型正式下线。这款备受瞩目的中型智能电动SUV自上市以来,凭借卓越的产品性能和前瞻设计理念,始终稳居高端纯电SUV市场销量榜首,成为行业标杆。此次下线不仅标志着ES6成为蔚来首款达成30万台产销量的车型,更彰显了蔚来在规模化制造能力与市场认可度方面的显著成就。蔚来汽车高层表示,未来...