上个月,人工智能领域掀起了一场激烈的”动物战争”,两大开源大模型家族——Meta的Llama(美洲驼)与NEC的日语版ChatGPT,以及Falcon(猎鹰)系列,展开了一场前所未有的技术对决。NEC在深入研究Llama论文和源代码后,迅速推出了日语版ChatGPT,为日本解决了AI技术瓶颈问题;而Falcon-40B在5月问世时力压Llama登顶开源LLM排行榜,这个由Hugging Face制作的榜单成为衡量大模型能力的标尺。排行榜上Llama与Falcon轮流登顶的景象持续不断,Llama 2推出后扳回一城,但9月初Falcon 180B的问世再次刷新了排名纪录,以68.74分的成绩力压Llama 2。有趣的是,Falcon的开发者并非传统科技公司,而是阿联酋科技创新研究所。政府人士曾表示:”我们参与这场竞赛是为了颠覆核心玩家”。180B版本发布次日,阿联酋人工智能部长奥马尔就入选《时代周刊》AI领域最具影响力的100人名单,与”AI教父”辛顿、OpenAI的阿尔特曼以及李彦宏等一同上榜。

如今AI领域已进入”群魔乱舞”的群雄逐鹿时代,全球各国纷纷推出”XX国版ChatGPT”计划。仅在海湾地区,沙特阿拉伯8月就为国内大学采购了3000多块H100芯片用于LLM训练。金沙江创投朱啸虎曾感慨:”当年看不起互联网商业模式创新,没想到硬科技大模型创业也变成了百模大战”。这场看似高难度的技术竞赛,为何会演变成各国纷纷推出类似产品的局面?

这一切都要归功于2017年谷歌八位计算机科学家发表的《Attention Is All You Need》论文。这篇被引次数第三高的论文公开了Transformer算法,点燃了本轮AI热潮。无论是GPT系列还是其他轰动世界的大模型,都站在了Transformer的肩膀上。在Transformer出现之前,”教机器读书”一直是公认的学术难题。人类阅读时不仅关注当前词句,更会结合上下文理解,但早期的神经网络输入彼此独立,无法理解长文本。直到2014年,伊利亚·苏茨凯弗使用循环神经网络(RNN)处理自然语言,使谷歌翻译性能大幅提升。RNN通过”循环设计”,让每个神经元既接受当前输入也接受上一时刻信息,从而具备结合上下文的能力。

然而RNN存在严重缺陷——顺序计算导致运行效率低下,难以处理大量参数。2015年,Noam Shazeer与同伴开始开发RNN替代品,最终诞生了Transformer。Transformer的两大变革:一是用位置编码取代循环设计实现并行计算,大幅提升训练效率;二是进一步加强上下文理解能力。Transformer的出现彻底改变了AI领域,将大模型从理论研究问题变成了工程问题。2019年OpenAI基于Transformer开发的GPT-2惊艳学术界,谷歌迅速推出性能更强的Meena,仅通过堆叠8.5倍训练参数和14倍算力就超越了GPT-2。Transformer问世后,学术界算法创新速度明显放缓,数据工程、算力规模和模型架构成为AI竞赛的关键。

计算机科学家吴恩达在斯坦福大学演讲时指出:”AI是一系列工具的集合,与电力和互联网等通用技术类似。”OpenAI虽仍是LLM风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力源自工程解决方案,若开源任何竞争对手都能迅速复现。预计未来其他大型科技公司也能打造出同等性能的大模型。

“百模大战”已从修辞手法变为现实。截至今年7月,中国大模型数量达130个,超过美国的114个,实现弯道超车。除中日阿联酋外,印度Bhashini、韩国HyperClova X等也推出了国家级大模型。这场AI竞赛仿佛重现了互联网泡沫时代的”钞能力”对轰。Transformer将大模型变成工程问题,但入场券虽易得,成为AI时代BAT却非易事。

“动物战争”中Falcon虽排名力压Llama,却未对Meta造成实质性冲击。Meta开源Llama系列既分享科技福祉,又调动开发者智慧。早在2015年组建AI实验室时,Meta就确立了开源基调。扎克伯格深谙社交媒体的群众关系之道,近期推出”AI版创作者激励”活动,资助使用Llama 2解决社会问题的开发者。截至10月初,Hugging Face开源LLM排行榜Top 10中8个基于Llama 2,仅Hugging Face上使用Llama 2协议的LLM就超过1500个。排名第一的LLM仍基于Llama 2打造,而Falcon等模型与GPT-4仍存在明显性能差距。

AgentBench测试显示,GPT-4以4.41分问鼎榜首,Claude仅2.77分,开源LLM多在1分左右徘徊。造成这种差距的不仅是参数,更是OpenAI科学家团队的科研实力和长期积累。大模型的核心能力在于生态建设(开源)或纯粹推理能力(闭源)。随着开源社区活跃,各模型性能可能趋同,因为大家都在使用相似架构和数据集。

更严峻的挑战是价值锚点的缺失。除了Midjourney等少数案例,大部分软件公司尚未想清楚如何盈利。微软的GitHub Copilot每月亏损20美元,重度用户甚至让微软每月倒贴80美元;Adobe也推出积分系统防止用户过度使用。微软和Adobe这些软件巨头都步履维艰,更不用说其他单纯堆砌参数的大模型供应商。没有OpenAI和ChatGPT的横空出世,这场AI革命或许根本不会发生;但在当下,训练大模型的价值值得商榷。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商空间将更小。iPhone 4的火爆不是因为45nm制程的A4处理器,而是因为它能玩植物大战僵尸和愤怒的小鸟。大模型需要找到类似的应用场景,才能真正实现商业化落地。

最新快讯

2025年08月17日

21:24
2025年8月17日,历时11天的第12届世界运动会在成都圆满落幕,这场国际体育盛事吸引了全球100多个国家和地区的运动员齐聚一堂,展开激烈角逐。作为由国际世界运动会协会主办的国际性综合赛事,世界运动会致力于推广非奥运会项目的全球发展,为全球体育文化注入新的活力。本届赛事的成功举办,不仅彰显了成都作为中国西部首个承办该赛事城市的卓越组织能力,更向世界展示了这...
21:24
加拿大航空公司于17日正式宣布,当晚将逐步恢复航班运营。此前由于突发状况,加航于16日凌晨1时30分紧急暂停了所有运营活动,这一决定导致大量飞机与机组人员面临重新调度难题。根据最新安排,首批航班预计在17日晚些时候起飞,但考虑到运营系统的复杂性,全面恢复航班运营可能需要数天时间。未来7至10天内,部分航班仍存在取消的可能性,直至新的时刻表完全确定并稳定运行。...
21:24
2025年8月17日,科技界迎来重磅消息,智元机器人正式发布了其最新研发成果——OmniHand 2025灵巧手。这款产品以其突破性的性能和创新设计,再次推动了人工智能与机器人技术的深度融合,为各行各业带来了前所未有的应用可能。令人惊喜的是,这款集高精度、高灵活性于一身的灵巧手,其最低售价仅为不足万元,极大地降低了高端机器人技术的市场门槛,有望加速智能机器人...
21:24
宣泰医药于8月17日发布公告,宣布控股股东联和投资基于对公司未来发展前景的坚定信心,主动作出承诺,自2025年8月25日起两年内,将不会通过集中竞价交易或大宗交易等任何方式减持公司股份。这一重要举措充分展现了联和投资对宣泰医药长期价值的认可,也体现了其维护公司股价稳定、保护投资者利益的决心。 此举不仅有助于提振市场信心,增强投资者对宣泰医药的信任,还将为资本...
19:56
智元机器人于8月17日发布重磅消息,正式推出全新一代OmniHand 2025系列灵巧手,这一创新举措标志着该公司在机器人核心部件研发领域取得突破性进展。该系列产品精心划分为两大类别——灵动款与专业款,分别针对日常交互服务场景和精密专业作业需求进行定制化设计。 据悉,灵动款OmniHand 2025灵巧手将于8月18日同步登陆智元商城及京东平台开启预售,其市...
19:56
8月17日,备受瞩目的首届世界人形机器人运动会圆满落下帷幕,这场科技与智能的盛宴汇聚全球顶尖人形机器人技术,共同探索未来机器人的无限可能。在这场高手云集的竞技中,宇树科技凭借其卓越的技术实力和精心研发的机器人,一举斩获四枚金牌,分别是在1500米、400米、100米障碍赛以及4×100米接力项目中的惊人表现。这些成绩不仅彰显了宇树科技在人形机器人领域的领先地...
19:55
2025年8月16日深夜22时许,内蒙古巴彦淖尔市乌拉特后旗乌盖苏木东乌盖沟上游地区遭遇突发山洪灾害,这场突如其来的自然灾害瞬间吞噬了宁静的夜空。据官方通报,共有10名野外露营人员不幸遇难,另有2人失联,1人奇迹获救。这场突如其来的灾难迅速引起了社会各界的广泛关注。 面对严峻的灾情,当地政府第一时间启动应急响应机制。截至8月17日17时20分,已紧急调集70...
19:55
8月16日,广东省佛山市新增52例基孔肯雅热确诊病例,引发社会广泛关注。具体病例分布情况如下:禅城区报告19例,南海区11例,顺德区18例,高明区2例,三水区2例。面对此次疫情,佛山市相关部门已迅速启动应急响应机制,全面开展疫情防控工作。目前,专业医疗团队正对确诊病例进行隔离治疗,同时加强了对密切接触者的追踪管理。此外,卫生防疫部门也在全市范围内开展了基孔肯...
19:55
8月16日,深港陆路口岸迎来历史性突破,单日出入境旅客总数高达102.71万人次,刷新了有记录以来的最高纪录。这一惊人数字背后,是两地人员往来的蓬勃活力。具体来看,当日出境旅客达46.81万人次,而入境旅客则达到55.9万人次,双向流动均呈现强劲态势。这一现象不仅彰显了深港合作关系的紧密程度,也反映出两地经济文化交流的日益频繁。随着粤港澳大湾区建设的深入推进...
18:48
2025年8月17日,智元机器人重磅发布OmniHand 2025系列灵巧手,为机器人行业带来革命性突破。该系列涵盖两大版本——面向日常交互服务的“灵动款”与专注专业作业的“专业款”,全面升级机器人的操作与交互能力。其中,灵动款2025灵巧手指指导价定为1.48万元,灵动触觉款首发线上价同样为1.48万元,原价1.98万元。这一系列产品的推出,标志着智元机器...
18:48
2025年8月18日,新横琴口岸迎来了其辉煌的五年庆典。这一重要跨境口岸自开通以来,不仅见证了区域经济的蓬勃发展,更成为连接粤港澳大湾区的关键纽带。据最新统计数据显示,截至8月17日17时,新横琴口岸累计验放人员已突破7560万人次,车辆通行量更是高达895万辆次,这一数字背后是年均增长率分别达55.6%和43.3%的惊人成绩。 作为粤港澳大湾区最繁忙的跨境...
18:48
2025年8月17日16时55分,北京时间精准定格在这一历史性时刻,我国在西昌卫星发射中心再次展现航天力量的巅峰技艺。长征四号丙运载火箭以雷霆万钧之势升空,将试验二十八号B星02星稳稳送入预定轨道,标志着我国航天事业迈入新纪元。此次发射任务不仅圆满成功,更彰显了我国在航天领域的卓越实力与持续创新精神。 试验二十八号B星02星肩负着空间环境探测的重要使命,其搭...