上个月,人工智能领域掀起了一场激烈的”动物战争”,两大开源大模型家族——Meta的Llama(美洲驼)与NEC的日语版ChatGPT,以及Falcon(猎鹰)系列,展开了一场前所未有的技术对决。NEC在深入研究Llama论文和源代码后,迅速推出了日语版ChatGPT,为日本解决了AI技术瓶颈问题;而Falcon-40B在5月问世时力压Llama登顶开源LLM排行榜,这个由Hugging Face制作的榜单成为衡量大模型能力的标尺。排行榜上Llama与Falcon轮流登顶的景象持续不断,Llama 2推出后扳回一城,但9月初Falcon 180B的问世再次刷新了排名纪录,以68.74分的成绩力压Llama 2。有趣的是,Falcon的开发者并非传统科技公司,而是阿联酋科技创新研究所。政府人士曾表示:”我们参与这场竞赛是为了颠覆核心玩家”。180B版本发布次日,阿联酋人工智能部长奥马尔就入选《时代周刊》AI领域最具影响力的100人名单,与”AI教父”辛顿、OpenAI的阿尔特曼以及李彦宏等一同上榜。

如今AI领域已进入”群魔乱舞”的群雄逐鹿时代,全球各国纷纷推出”XX国版ChatGPT”计划。仅在海湾地区,沙特阿拉伯8月就为国内大学采购了3000多块H100芯片用于LLM训练。金沙江创投朱啸虎曾感慨:”当年看不起互联网商业模式创新,没想到硬科技大模型创业也变成了百模大战”。这场看似高难度的技术竞赛,为何会演变成各国纷纷推出类似产品的局面?

这一切都要归功于2017年谷歌八位计算机科学家发表的《Attention Is All You Need》论文。这篇被引次数第三高的论文公开了Transformer算法,点燃了本轮AI热潮。无论是GPT系列还是其他轰动世界的大模型,都站在了Transformer的肩膀上。在Transformer出现之前,”教机器读书”一直是公认的学术难题。人类阅读时不仅关注当前词句,更会结合上下文理解,但早期的神经网络输入彼此独立,无法理解长文本。直到2014年,伊利亚·苏茨凯弗使用循环神经网络(RNN)处理自然语言,使谷歌翻译性能大幅提升。RNN通过”循环设计”,让每个神经元既接受当前输入也接受上一时刻信息,从而具备结合上下文的能力。

然而RNN存在严重缺陷——顺序计算导致运行效率低下,难以处理大量参数。2015年,Noam Shazeer与同伴开始开发RNN替代品,最终诞生了Transformer。Transformer的两大变革:一是用位置编码取代循环设计实现并行计算,大幅提升训练效率;二是进一步加强上下文理解能力。Transformer的出现彻底改变了AI领域,将大模型从理论研究问题变成了工程问题。2019年OpenAI基于Transformer开发的GPT-2惊艳学术界,谷歌迅速推出性能更强的Meena,仅通过堆叠8.5倍训练参数和14倍算力就超越了GPT-2。Transformer问世后,学术界算法创新速度明显放缓,数据工程、算力规模和模型架构成为AI竞赛的关键。

计算机科学家吴恩达在斯坦福大学演讲时指出:”AI是一系列工具的集合,与电力和互联网等通用技术类似。”OpenAI虽仍是LLM风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力源自工程解决方案,若开源任何竞争对手都能迅速复现。预计未来其他大型科技公司也能打造出同等性能的大模型。

“百模大战”已从修辞手法变为现实。截至今年7月,中国大模型数量达130个,超过美国的114个,实现弯道超车。除中日阿联酋外,印度Bhashini、韩国HyperClova X等也推出了国家级大模型。这场AI竞赛仿佛重现了互联网泡沫时代的”钞能力”对轰。Transformer将大模型变成工程问题,但入场券虽易得,成为AI时代BAT却非易事。

“动物战争”中Falcon虽排名力压Llama,却未对Meta造成实质性冲击。Meta开源Llama系列既分享科技福祉,又调动开发者智慧。早在2015年组建AI实验室时,Meta就确立了开源基调。扎克伯格深谙社交媒体的群众关系之道,近期推出”AI版创作者激励”活动,资助使用Llama 2解决社会问题的开发者。截至10月初,Hugging Face开源LLM排行榜Top 10中8个基于Llama 2,仅Hugging Face上使用Llama 2协议的LLM就超过1500个。排名第一的LLM仍基于Llama 2打造,而Falcon等模型与GPT-4仍存在明显性能差距。

AgentBench测试显示,GPT-4以4.41分问鼎榜首,Claude仅2.77分,开源LLM多在1分左右徘徊。造成这种差距的不仅是参数,更是OpenAI科学家团队的科研实力和长期积累。大模型的核心能力在于生态建设(开源)或纯粹推理能力(闭源)。随着开源社区活跃,各模型性能可能趋同,因为大家都在使用相似架构和数据集。

更严峻的挑战是价值锚点的缺失。除了Midjourney等少数案例,大部分软件公司尚未想清楚如何盈利。微软的GitHub Copilot每月亏损20美元,重度用户甚至让微软每月倒贴80美元;Adobe也推出积分系统防止用户过度使用。微软和Adobe这些软件巨头都步履维艰,更不用说其他单纯堆砌参数的大模型供应商。没有OpenAI和ChatGPT的横空出世,这场AI革命或许根本不会发生;但在当下,训练大模型的价值值得商榷。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商空间将更小。iPhone 4的火爆不是因为45nm制程的A4处理器,而是因为它能玩植物大战僵尸和愤怒的小鸟。大模型需要找到类似的应用场景,才能真正实现商业化落地。

最新快讯

2025年11月02日

11:10
铭凡迷你主机品牌于10月31日正式宣布,由于全球原材料成本持续上涨,公司决定对全线产品进行小幅价格调整。此次调整将于太平洋标准时间11月4日起生效,但准系统及配件产品将保持原价不变。 该公司在声明中明确指出,近期DRAM内存与NAND闪存价格的快速攀升是导致成本增加的主要因素。作为业内知名的分析机构预测,第四季度DRAM和NAND闪存的价格涨幅或将分别达...
11:10
理想汽车产品线负责人汤靖就MEGA 2024款起火事件作出权威回应,详细披露了事故发生前的关键预警信息。据他透露,在事故发生前的四个小时内,云端系统已监测到电池绝缘故障的潜在风险,并第一时间通过客服渠道联系车主,启动了应急救援程序。然而,由于车辆仅因小电瓶馈电导致暂时抛锚,维修团队未能采取拖车送检等更有效的措施,最终导致风险升级为严重的热失控事故。 汤靖坦诚...
11:10
中国上市公司协会最新发布的数据显示,前三季度A股市场展现出稳健的增长态势。上市公司合计实现营业收入高达53.46万亿元,净利润达到4.70万亿元,同比分别增长1.36%和5.50%。这一成绩背后,是全市场4183家企业的盈利表现,盈利面接近八成,彰显出A股市场的整体韧性。 从季度维度来看,第三季度的业绩表现尤为亮眼。上市公司营收和净利润同比增速分别达到3.8...
11:10
极氪009纯电MPV重磅推出限时购车福利,11月至12月期间为消费者带来双重惊喜:5年0息金融方案与1万元置换补贴任选其一,让高端出行更轻松实惠。不仅如此,购车用户还能尊享豪华酒店度假活动,100%获得最高3000元家庭度假金,更有每月三次机会赢取价值8000元的三亚家庭游,让出行体验升级倍增。 作为极氪高端MPV系列的开篇之作,009纯电MPV自今年7月推...
11:10
央视新闻报道显示,今年前三季度我国高技术制造业发展势头强劲,增加值同比增长9.6%,增速显著领先于整体工业水平3.4个百分点。这一成绩背后是智能无人机、工业机器人等创新产品的蓬勃发展,其产量均呈现爆发式增长。特别是在工业机器人领域,前三季度累计产量已突破59.5万套,不仅远超去年全年总量,更反映出行业加速迭代升级的态势。 随着汽车、电子等传统产业加速自动化改...
11:10
日产汽车于当地时间10月30日正式发布了2025财年第二财季及上半财年的最新财务展望。这一消息不仅揭示了公司近期的经营状况,更展现了其在复杂市场环境下的稳健表现与战略调整成效。 尽管净营收方面维持了此前预期,但日产汽车在营业利润表现上实现了令人瞩目的突破。公司最新数据显示,第二财季预计实现净收入2.8万亿日元,营业利润将达到500亿日元,利润率更是提升至1....
11:10
2025年11月,备受瞩目的中国国际人工智能大会在上海圆满落幕。在这场汇聚全球顶尖AI智慧的行业盛会上,一亩田集团凭借其在农业全产业链中深度应用的AI技术,脱颖而出,荣获“十大创新力企业奖”这一殊荣,并荣登“中国人工智能行业创新力企业百强榜”。值得注意的是,此次获奖名单中不仅囊括了阿里云、华为、京东等科技领域的领军企业,更有一亩田集团作为农业数字化先锋的闪亮...
10:40
微新创想11月2日讯 鸿蒙智行近日震撼发布了其最新销量报告,10月份的业绩表现更是创下历史性双纪录。单月交付量高达68216台,不仅刷新了单月交付量历史新高,更以惊人的速度突破了100万台大关,成为创新势力品牌最快达成百万交付纪录的里程碑时刻。值得注意的是,鸿蒙智行10月份的成交均价达到了39万元,这一数字甚至超越了宝马、奔驰、奥迪等传统豪华品牌,强势跃居中...
10:40
微新创想11月1日最新消息,知名数码博主数码闲聊站曝出重要进展:某品牌旗下子系列将采用9000mAh单电芯硅电池并实现100W闪充方案,更有实验室测试显示10000mAh版本已进入积极评估阶段。根据博主评论区透露的线索,这款备受期待的机型很可能就是REDMI Turbo 5系列。 目前,REDMI K90系列凭借其精准的市场定位和极具竞争力的售价,已在全球市...
10:37
2025年9月,全国工业机器人产量强势突破7.63万套,同比增长率高达28.3%,展现出强劲的增长势头。更值得关注的是,1—9月累计产量已达到惊人的59.5万套,不仅远超2024年全年的总量,更标志着中国工业机器人产业迈入高速发展新阶段。这一显著增长主要得益于汽车、电子、新能源等关键行业的自动化改造需求持续旺盛,这些行业对智能化生产技术的迫切需求正成为推动机...
10:37
知名投资人段永平近日向江西水利电力大学慷慨捐赠1万股贵州茅台股票,并以其父母名义设立专项教育基金,此举彰显了其深厚的教育情怀。此次捐赠的茅台股票市值约1500万元,不仅为学校带来了可观的资产增值空间,更体现了段永平对教育事业的长期承诺。校方对此表示高度赞赏,称这是继2007年捐建图书馆后,段永平对该校的又一次重要支持,进一步巩固了双方的良好合作关系。 面对外...
10:37
佳能集团近日发布了2025年第三季度的财务报告,数据显示公司营业额达到11043.24亿日元,折合人民币约510.63亿元,同比增长2.3%,不仅刷新了该季度历史记录,更彰显了企业稳健的发展态势。这份亮眼的成绩单背后,是佳能两大核心业务板块——影像与工业领域的卓越表现,为整个集团的发展注入强劲动力。 在影像业务方面,佳能持续巩固市场领导地位,营收达到2536...