上个月,人工智能领域掀起了一场激烈的”动物战争”,两大开源大模型家族——Meta的Llama(美洲驼)与NEC的日语版ChatGPT,以及Falcon(猎鹰)系列,展开了一场前所未有的技术对决。NEC在深入研究Llama论文和源代码后,迅速推出了日语版ChatGPT,为日本解决了AI技术瓶颈问题;而Falcon-40B在5月问世时力压Llama登顶开源LLM排行榜,这个由Hugging Face制作的榜单成为衡量大模型能力的标尺。排行榜上Llama与Falcon轮流登顶的景象持续不断,Llama 2推出后扳回一城,但9月初Falcon 180B的问世再次刷新了排名纪录,以68.74分的成绩力压Llama 2。有趣的是,Falcon的开发者并非传统科技公司,而是阿联酋科技创新研究所。政府人士曾表示:”我们参与这场竞赛是为了颠覆核心玩家”。180B版本发布次日,阿联酋人工智能部长奥马尔就入选《时代周刊》AI领域最具影响力的100人名单,与”AI教父”辛顿、OpenAI的阿尔特曼以及李彦宏等一同上榜。

如今AI领域已进入”群魔乱舞”的群雄逐鹿时代,全球各国纷纷推出”XX国版ChatGPT”计划。仅在海湾地区,沙特阿拉伯8月就为国内大学采购了3000多块H100芯片用于LLM训练。金沙江创投朱啸虎曾感慨:”当年看不起互联网商业模式创新,没想到硬科技大模型创业也变成了百模大战”。这场看似高难度的技术竞赛,为何会演变成各国纷纷推出类似产品的局面?

这一切都要归功于2017年谷歌八位计算机科学家发表的《Attention Is All You Need》论文。这篇被引次数第三高的论文公开了Transformer算法,点燃了本轮AI热潮。无论是GPT系列还是其他轰动世界的大模型,都站在了Transformer的肩膀上。在Transformer出现之前,”教机器读书”一直是公认的学术难题。人类阅读时不仅关注当前词句,更会结合上下文理解,但早期的神经网络输入彼此独立,无法理解长文本。直到2014年,伊利亚·苏茨凯弗使用循环神经网络(RNN)处理自然语言,使谷歌翻译性能大幅提升。RNN通过”循环设计”,让每个神经元既接受当前输入也接受上一时刻信息,从而具备结合上下文的能力。

然而RNN存在严重缺陷——顺序计算导致运行效率低下,难以处理大量参数。2015年,Noam Shazeer与同伴开始开发RNN替代品,最终诞生了Transformer。Transformer的两大变革:一是用位置编码取代循环设计实现并行计算,大幅提升训练效率;二是进一步加强上下文理解能力。Transformer的出现彻底改变了AI领域,将大模型从理论研究问题变成了工程问题。2019年OpenAI基于Transformer开发的GPT-2惊艳学术界,谷歌迅速推出性能更强的Meena,仅通过堆叠8.5倍训练参数和14倍算力就超越了GPT-2。Transformer问世后,学术界算法创新速度明显放缓,数据工程、算力规模和模型架构成为AI竞赛的关键。

计算机科学家吴恩达在斯坦福大学演讲时指出:”AI是一系列工具的集合,与电力和互联网等通用技术类似。”OpenAI虽仍是LLM风向标,但半导体分析机构Semi Analysis认为GPT-4的竞争力源自工程解决方案,若开源任何竞争对手都能迅速复现。预计未来其他大型科技公司也能打造出同等性能的大模型。

“百模大战”已从修辞手法变为现实。截至今年7月,中国大模型数量达130个,超过美国的114个,实现弯道超车。除中日阿联酋外,印度Bhashini、韩国HyperClova X等也推出了国家级大模型。这场AI竞赛仿佛重现了互联网泡沫时代的”钞能力”对轰。Transformer将大模型变成工程问题,但入场券虽易得,成为AI时代BAT却非易事。

“动物战争”中Falcon虽排名力压Llama,却未对Meta造成实质性冲击。Meta开源Llama系列既分享科技福祉,又调动开发者智慧。早在2015年组建AI实验室时,Meta就确立了开源基调。扎克伯格深谙社交媒体的群众关系之道,近期推出”AI版创作者激励”活动,资助使用Llama 2解决社会问题的开发者。截至10月初,Hugging Face开源LLM排行榜Top 10中8个基于Llama 2,仅Hugging Face上使用Llama 2协议的LLM就超过1500个。排名第一的LLM仍基于Llama 2打造,而Falcon等模型与GPT-4仍存在明显性能差距。

AgentBench测试显示,GPT-4以4.41分问鼎榜首,Claude仅2.77分,开源LLM多在1分左右徘徊。造成这种差距的不仅是参数,更是OpenAI科学家团队的科研实力和长期积累。大模型的核心能力在于生态建设(开源)或纯粹推理能力(闭源)。随着开源社区活跃,各模型性能可能趋同,因为大家都在使用相似架构和数据集。

更严峻的挑战是价值锚点的缺失。除了Midjourney等少数案例,大部分软件公司尚未想清楚如何盈利。微软的GitHub Copilot每月亏损20美元,重度用户甚至让微软每月倒贴80美元;Adobe也推出积分系统防止用户过度使用。微软和Adobe这些软件巨头都步履维艰,更不用说其他单纯堆砌参数的大模型供应商。没有OpenAI和ChatGPT的横空出世,这场AI革命或许根本不会发生;但在当下,训练大模型的价值值得商榷。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商空间将更小。iPhone 4的火爆不是因为45nm制程的A4处理器,而是因为它能玩植物大战僵尸和愤怒的小鸟。大模型需要找到类似的应用场景,才能真正实现商业化落地。

最新快讯

2025年08月18日

04:37
2025年8月18日,公募FOF基金市场迎来显著变化,其投资策略正逐步向股票型基金倾斜,并取得了令人瞩目的业绩表现。根据最新数据统计,今年超九成的FOF产品均实现了正收益,部分产品更是以高达34.28%的年度收益率脱颖而出,展现出强大的投资能力。这一优异表现背后,是FOF基金对市场趋势的精准把握和灵活调整。 市场排名前十的FOF基金普遍呈现出明显的投资偏好,...
03:21
截至2025年第二季度末,保险公司资金运用规模再创新高,总余额已突破36万亿元大关,达到36.23万亿元,较去年同期增长17.4%。这一显著增长反映出保险资金运用的活跃度和市场信心的持续提升。 在各类投资中,人身险公司的股票投资表现尤为亮眼。其股票投资余额增至2.87万亿元,环比增长超过2000亿元,投资占比也随之提升至8.81%。这一数据不仅体现了人身险公...
01:41
8月18日10时整,琼州海峡客滚船正式恢复运输服务。这一重要决策是基于南海热带低压带来的风雨影响已显著减弱,经交通运输、海事等部门联合评估并达成共识后作出的。为保障恢复后的运输安全与效率,湛江海事局已全面启动应急预案,将加大对关键航道的巡查频次与力度,并优化船舶调度机制,确保每一艘过海船只都能在安全有序的环境下运行。 为方便旅客出行,建议广大过海人员提前通过...
01:41
2025年8月18日,香港天文台正式发布黄色暴雨警告,提醒市民高度关注即将到来的强降雨天气。此次预警范围覆盖香港大部分地区,预计未来数小时内将迎来持续性的强降雨。气象部门特别强调,此次暴雨可能引发城市内涝、山泥倾泻等次生灾害,建议市民尽量减少非必要外出,做好各项防汛准备。相关部门还呼吁车主注意交通安全,避免驾车涉水,同时加强巡查重点区域,确保排水系统畅通。市...
00:35
2025年8月17日,备受瞩目的2025世界人形机器人运动会100米与4x100米决赛圆满落幕,再次见证了人工智能与机器人技术的巅峰对决。在这场科技与速度的较量中,由北京人形机器人创新中心自主研发的具身天工Ultra以全自主参赛模式惊艳全场,不仅以绝对优势夺得了100米赛跑的冠军,还在4x100米接力赛中与队友默契配合,助力团队勇夺亚军,充分展现了我国在人形...

2025年08月17日

23:30
2025年8月17日,一个具有里程碑意义的时刻全球人形机器人运动联合会在万众瞩目下正式宣告成立这一举措标志着人形机器人领域进入了一个崭新的发展阶段。联合会旨在搭建一个国际化的交流平台促进全球范围内人形机器人技术的创新与突破同时推动体育赛事与前沿科技的深度融合为人类探索人工智能与机器人技术的未来开辟了无限可能。 就在同一天赛事主办方也发布了令人振奋的消息宣布将...
23:30
8月17日,中信建投证券最新研报深入剖析了本轮始于6月23日的慢牛行情,揭示了其未来可能呈现的两种演化路径。第一种路径是市场经历阶段性回调整固后,有望延续稳健的慢牛格局,为投资者带来持续的价值回报。第二种路径则相对严峻,若市场因交易过热导致泡沫累积,或因行业结构出现恶化迹象,可能引发大幅回调,从而终结本轮行情的上涨趋势。 研报进一步指出,当前市场整体呈现出结...
23:30
2025年上半年,资本市场呈现出显著的业绩分化态势。多家上市公司陆续发布半年报,业绩波动成为市场焦点。其中,农业龙头企业圣农发展表现亮眼,净利润高达9.1亿元,同比激增791.93%,展现出强劲的增长动力。新能源材料供应商四方光电同样实现盈利能力大幅提升,净利润达到8412.38万元,同比增长103.41%,彰显行业景气度持续上行。而在稀有金属领域,华友钴业...
23:30
2025年8月17日,小商品城正式发布其2025年半年财务报告,数据显示公司经营业绩呈现强劲增长态势。报告期内,公司实现营业收入77.13亿元,较去年同期增长13.99%,这一增长幅度充分展现了市场对小商品城产品与服务的持续认可。更令人瞩目的是,公司归母净利润达到16.91亿元,同比增长16.78%,利润率的提升进一步印证了公司盈利能力的增强。 在资本市场层...
23:30
加勒比海岛国正遭受飓风“埃林”的猛烈袭击,暴雨如注,洪水肆虐,山体滑坡频发,给当地居民的生命财产安全带来严重威胁。令人震惊的是,这场灾难性的飓风在短短24小时内完成了从一级到五级的惊人跃升,其最大持续风速一度接近每小时255公里,成为有记录以来增强速度最快的热带气旋之一。尽管目前“埃林”已减弱为三级飓风,但其残留的破坏力依然不容小觑,预计将对该地区造成深远的...
22:10
本周(8月11日至8月15日)A股市场资金流向呈现明显分化态势,主力资金重点布局非银金融与银行板块,其中非银金融板块更是迎来超120亿元的大额净流入,显示出市场对该板块的强烈看好。从个股层面来看,东方财富表现尤为抢眼,主力资金净流入高达90.05亿元,带动股价周涨幅飙升至15.34%,成为板块内最耀眼的明星。与此同时,宁德时代、歌尔股份等科技股也获得不同程度...
22:10
2025年8月17日市场动态分析 本周A股市场呈现异常活跃态势,共有105只个股换手率突破100%大关,展现出强烈的资金博弈特征。从行业分布来看,机械设备、计算机、电子等高成长板块成为资金关注的焦点,个股活跃度显著提升。 在换手率排行榜上,C广建科以惊人的286.40%周换手率独占鳌头,成为市场中最受资金追捧的个股之一。北纬科技和浙江华业分别以246.16%...