ChatGPT在全球范围内掀起了AI大模型的浪潮。本文来自微信公众号“自象限原创”(ID:zixiangxian),作者:罗辑,编辑:庄颜,经微新创想授权发布。在美国,以OpenAI、Anthropic等初创企业和微软、Google为代表的科技巨头正引领着AI大模型的发展,最大参数已达到5620亿。在中国,美团王慧文、阿里贾扬清、前搜狗CEO王小川、前京东AI掌门人周伯文等科技大佬纷纷投身其中。AI大模型的发展如烈火烹油,但在这一轮浪潮中,关注点主要集中在中美两国。然而,世界其他国家和地区如何看待AI大模型,在发展大模型上又取得了哪些进展,不同国家和地区的AI大模型发展呈现出哪些特点?这些问题在中美的光环下往往被忽视。俗话说“他山之石,可以攻玉”,在这样的背景下,“自象限”梳理了包括中国、美国、韩国、日本和欧洲等主要国家AI大模型的发展现状。我们发现,一方面,不同国家AI大模型的发展与所在国的互联网发展密切相关;另一方面,芯片、云计算、高质量数据等产业基础,模型架构和算法经验,以及用户群体、社会文化等因素共同决定了所在国家AI大模型的发展高度。正如比尔·盖茨将ChatGPT的发布比作互联网的发明,并认为它可以改变世界一样,英伟达CEO黄仁勋也在GTC2023上三次提到“AI迎来iPhone时刻”。AI大模型是全球的机会,而中国创业者更不应存在视野盲区。将视野拉远便会发现,各国大模型都继承了本国的“基因”,前二十年互联网与科技积累的成果,在AI 2.0的大考下瞬间爆发。有人交了满分答卷,也有人名落孙山。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图

美国:实力雄厚,独占鳌头美国在AI大模型方面的强盛并非一时,而是由来已久。从2012年AI萌芽时期,到2016年AI1.0时期,再到2022年ChatGPT带来的AI2.0时期,美国一直是AI领域的破局者,引领着全球AI发展不断向前。例如,目前几乎所有AI大模型训练时采用的Transformer网络结构,是由谷歌在2017年提出的。Transformer网络结构具有优秀的长序列处理能力、更高的并行计算效率、无需手动设计以及更强的语义表达能力等特征,它让大模型训练成为可能。保证AI大模型出现在美国的另一个关键因素,是美国云大厂和英伟达手握全球算力核心资源。云计算能够为AI大模型训练提供计算、存储、网络和应用平台,同时提供数据处理、模型部署、推理等AI工具和服务,让企业能够快速训练大模型,无需花费大量时间和金钱去建立和维护自己的数据中心。目前,美国拥有世界上最大的云计算企业。IDC数据显示,2021年全球IaaS市场中,亚马逊、微软、谷歌、IBM等美国企业合计占比近70%。而美国最具代表性的AI大模型初创企业,无论是OpenAI还是Anthropic,都接受了微软和谷歌等云大厂的投资。这背后除了资金支持外,更重要的原因还在于背后的云计算资源。算力的另一个维度是芯片,高性能的芯片可以提供更加高效的计算能力,从而加速训练过程。速度有多快呢?2016年,黄仁勋亲手将世界第一台DGX-1(英伟达计算平台)捐献给了OpenAI,DGX-1是3000人花费3年时间才研发出来的首个轻量化的小型超算,计算和吞吐能力相当于250台传统服务器。有了DGX-1,OpenAI之前一年的计算量只要一个月就能完成。而目前为止,英伟达的A100芯片仍然是唯一能够在云端实际执行任务的GPU芯片。最近的GTC2023上,黄仁勋又更新了新芯片H100的进度。H100配有Transformer引擎,可以专门用作处理类似ChatGPT的AI大模型,由其构建的服务器效率是A100的十倍。可以说,在AI大模型领域,目前的美国就是妥妥的“别人家孩子”,这也导致目前行业最具代表性的AI大模型都集中在美国。比如OpenAI最新发布的多模态预训练大模型GPT-4,谷歌最新推出“通才”大模型PaLM-E,拥有世界最大规模的5620亿参数,能看图说话、能操控机器人,以及刚刚解决AI绘画手指问题的Midjourney等等。但在快速发展的过程中,美国业界对于AI大模型也持激进和保守两种不同的态度。其中,微软支持的OpenAI在推动大模型落地时就更加激进。根据OpenAI关于GPT-4的安全文档,OpenAI曾在发布GPT-4前聘请安全专家进行测试。OpenAI在文档中写道:“GPT-4表现出一些特别令人担忧的能力,例如制定和实施长期计划的能力,积累权力和资源(寻求权力),以及表现出越来越‘代理’的行为。”因此有安全专家建议将GPT-4的部署时间推迟6个月,到今年秋季再发布,但OpenAI并没有采纳这份建议。而另一方面,在ChatGPT发布之后,谷歌曾表示自己已经具备相似能力的AI大模型,但基于安全考虑并没有及时推向市场。包括OpenAI创始人Sam Altman和马斯克都曾多次在公开场合表达了对AI大模型和人工智能的担忧,表示应该更谨慎地对待大模型的市场化。目前由谷歌投资的,能够对标OpenAI的另一家AI初创公司Anthropic其实就是因为这样的理念不同,而从OpenAI出走并自立门户。当然,在激烈的市场竞争下,即使曾经相对谨慎的谷歌也似乎忘记了这条担忧,并在3月7日报复性砸出5620亿参数大模型,甚至能够控制机器人运动。目前,以微软和OpenAI为代表,美国AI大模型正在积极推动产业应用。微软早在2月份就宣布将会在全线产品接入ChatGPT,并以几乎一周一个产品的速度向外更新。从New Bing到加入最新功能Copilot的Microsoft Teams正在搅动全球的产业变革。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图1

日本:错失互联网,错失云,错失AI如果说美国是最厉害的大模型“老炮”,那日本可能就要沦为这次排名的“吊车尾”。日本的落后其实要从上个互联网时代讲起。我们盘点世界AI大模型领域的关键角色会发现,无论是中国的BAT,韩国的Naver,还是美国的谷歌、亚马逊,他们都是互联网时代的巨头。一方面,这些企业通过互联网业务积累了大量的高质量数据;另一方面,他们在自身业务推动下建立了完整的云计算体系。但盘点之后我们发现,整个日本既没有叫得出名字的互联网巨头,也没有拿得出手的云计算厂商。目前,日本的即时通讯软件来自韩国的LINE,云计算业务也被美国企业长期把持。2022年,日本云计算市场份额约占全球的4%,排名第四。但日本云计算市场的主要竞争者却是美国的三大云巨头亚马逊、微软和谷歌,它们在日本的市场占有率已经达到60%~70%。除此之外,日本其实还面临许多其他问题,比如由于半导体产业的衰落,让日本在本应成为最大优势的AI芯片领域缺位;比如作为一个小语种国家,日语面临和中文一样缺乏语料的问题。在这样的背景下,日本在AI时代其实早就丧失了自主权。所以我们盘点日本的AI大模型,会发现它们大多具有美国或者韩国色彩。比如日本最早公开上线的NLP大模型是2020年发布的NTELLILINK Back Office NLP,当时它能实现如文档分类、知识阅读理解、自动总结等功能。但NTELLILINK Back Office是在谷歌BERT基础上开发的应用,就像中国许多基于GPT-3开发的应用一样。更有日本血统的生成式AI其实是HyperCLOVA、Rinna 和 ELYZA Pencil,但其中HyperCLOVA 和 Rinna 也都有外国基因。其中,HyperCLOVA最早是韩国搜索巨头NAVER在2021年推出的,其日本版是由NAVER和其子公司LINE(韩国软件在日本经营)一起研发。但HyperCLOVA确实是第一个专门针对日语的大语言模型,其通过爬取日本的博客服务来获取训练数据,并在2021年举行的对话系统现场比赛中获得了所有赛道的第一名。基于HyperCLOVA,LINE也推出许多应用,比如聊天机器人CLOVA Chatbot、图像识别CLOVA OCR和科洛瓦演讲CLOVA Speech等等。HyperCLOVA拥有820亿参数,目前正计划通过超100亿页的日文数据作为学习数据将模型规模扩大到1750亿。日本的另一个AI大模型Rinna则与微软有关,Rinna最早是微软日本研发的一款聊天机器人,类似于国内的小冰(之前叫微软小冰,目前已独立运营)。2021年8月,Rinna发布了一个名为GPT2-medium的模型,然后又在次年推出了日本版的GPT-2,参数达到13亿。日语版GPT-2与GPT-2的区别在于,GPT-2采用的是英文语料,而日语版GPT-2是基于日语语料训练。目前,Rinna的日语版GPT-2和HyperCLOVA已经是日本参数规模最大,最具代表性的大模型了。当然,日本也有一些真正土生土长的大模型,比如2022年3月,由东京大学松尾研究所的AI初创公司ELYZA Co., Ltd.推出大语言模型,它以产品“ELYZA Pencil”的方式推向市场。输入几个关键字,ELYZA Pencil可以在大约6秒内创建三种类型的日语新闻报道、电子邮件或简历。所以算起来,ELYZA Pencil才算真正意义上日本首次公开发布的生成式AI产品,但仅有ELYZA Pencil显然很难成为全村的希望。日本政府其实也在想办法扭转这种局面,比如2022年5月,日本政府计划将云计算服务列为涉及国家安全的“特定重要物资”,并将加强日本本国的“国产云”,但执行下来其实收效甚微。毕竟无论是互联网还是云计算都是规模经济,需要有足够的市场容量才能产生经济效益。这也导致日本互联网和云计算无论是在全球市场,还是在本土市场都缺乏充足的成长空间。但即便如此,日本市场也在积极做着大模型的应用的研究。比如2022年5月,东京大学和Google Brain的一个研究团队发布了论文《Large Language Models are Zero-Shot Reasoners》,解决了大模型0样本学习的部分问题。而在日本的互联网上,日本网友也在积极调用GPT-3的API,尝试开发自己的独特应用。此外,在刚刚举行的英伟达GTC 2023上,英伟达与日本三菱联合打造了日本第一台用于加速药研的生成式AI超级计算机。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图2

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图3

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图4

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图5

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图6

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图7

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图8

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图9

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图10

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图11

最新快讯

2025年08月11日

09:14
微新创想8月10日深度报道 夏季蚊虫肆虐引发健康危机 杭州近期持续高温伴随暴雨天气,为蚊虫繁殖提供了绝佳条件。家住西湖区的李阿姨最近深受蚊虫叮咬困扰,皮肤红肿瘙痒让她寝食难安。在邻里建议下,她尝试了一个看似简单却极其危险的方法——往鞋子里喷洒敌敌畏以驱蚊防叮。 然而这个"土方法"带来的后果远超想象。次日清晨,李阿姨发现自己的双脚突然布满密集的水泡,剧...
09:14
近日,一则来自美国的健康警示报道引发社会广泛关注。一位60岁的男子在咨询人工智能聊天机器人ChatGPT后,盲目改变饮食习惯,最终导致严重的健康危机。他在坚持这种极端饮食三个月后,突然出现偏执、幻觉等精神症状,不得不紧急前往医院急诊科求医。 图源备注:图片由AI生成,图片授权服务商Midjourney提供 经过医院医生的详细检查,这名男子被确诊为溴中毒。医生...
09:14
【AIbase 报道】近日,中国人在形机器人领域取得重大突破,智元机器人宣布与富临精工股份有限公司达成数千万元的项目合作,这一合作标志着其自主研发的远征 A2-W 轮式通用机器人即将在国内实现首个工业领域具身机器人的规模化商业部署。这一消息不仅令人振奋,更彰显了中国在智能制造领域的创新实力。 根据双方达成的协议,近百台远征 A2-W 机器人将进驻富临精工工厂...
09:14
微软近日正式宣布,其 Windows 11(以及 Windows 10)平台上的 Copilot 应用已全面升级,成功集成了由 GPT-5 驱动的智能模式。这一创新功能自 8 月 7 日起逐步推出,目前已在包括美国在内的多个地区广泛上线,迅速吸引了大量用户的目光。Copilot 应用的核心撰写框采用了先进的“Web 路由”技术,能够智能识别并自动提取 Azu...
09:14
【AIbase 报道】在人工智能技术浪潮席卷全球的今天,一种名为“脑腐病”的创意视频正以惊人的速度在互联网上蔓延,尤其受到年轻群体的热烈追捧。这些视频凭借其天马行空的想象力,创造出无数令人瞠目结舌的奇特形象,如“穿着运动鞋的鲨鱼”和“头顶卡布奇诺咖啡的芭蕾舞演员”等,不断刷新着人们的创意边界。这一现象的背后,离不开一家名为 OpenArt 的创新公司的推动。...
09:14
科技界传来重磅消息,知名科技记者古尔曼近日独家爆料,苹果公司正全力推进一项革命性的 Siri 语音控制技术革新。这项备受期待的新功能将彻底改变 iPhone 用户与设备的交互方式,通过更智能的语音指令实现精准操作,让手机使用变得前所未有的便捷高效。 据悉,苹果此次升级的 Siri 将深度整合最新的 App Intents 技术,打造前所未有的跨应用语音控...
09:14
xAI公司今日震撼全球科技界,正式宣布Grok4人工智能模型将面向全球用户永久免费开放。这一战略决策不仅彰显了xAI在人工智能领域的雄心壮志,更将先进AI技术推向了普惠时代,让全球用户都能零门槛体验顶尖AI服务。与市面上常见的试用或限时优惠不同,Grok4的免费策略是彻底且永久的,xAI致力于打造一个真正开放、共享的AI生态。 Grok4提供两种灵活的使用模...
09:14
2025年8月11日,艾可蓝传来振奋人心的消息,其甲醇重整制氢系统原理样机已成功开发完成。这一里程碑式的成果不仅验证了公司所选择的技术路线具有高度可行性,更在关键性能指标上展现出卓越表现,为未来大规模商业化应用奠定了坚实基础。 作为氢能领域的技术先锋,艾可蓝始终致力于探索高效、清洁的制氢路径。此次甲醇重整制氢系统的成功研发,标志着公司在新能源技术领域再获...
09:14
人民网北京8月11日电 东风集团股份于今日上午9时起在港交所实施短暂停牌。根据公司最新公告披露,此次停牌主要目的是为了发布一份涉及公司内部重要信息的公告。目前停牌时间已正式从上午9时开始,但关于公告的具体内容尚未对外公布。市场高度关注此次停牌背后可能涉及的重大事项,预计相关公告内容将在停牌期间尽快披露,以回应投资者关切。此次停牌事件也反映出公司对信息披露的严...
09:14
2025年8月8日,ASMPT集团宣布一项重要战略决策,其间接全资附属公司——位于深圳的先进半导体设备(深圳)有限公司,已通过股东决议正式成立清盘委员会。此举严格遵循中国相关法律法规,旨在启动对该公司的自愿清盘程序。ASMPT集团表示,这一决策的核心目标是优化其全球供应链布局,以更高效地应对瞬息万变的市场环境及客户需求升级。 清盘委员会将全面负责深圳先进半导...
09:14
8月9日,备受瞩目的新能源巨头宁德时代在江西宜春的采矿项目遭遇了运营暂停。这一情况源于其采矿许可证的到期失效,导致相关开采作业被迫中止。面对这一突发状况,宁德时代迅速作出回应,表示将严格遵守国家相关规定,积极推动采矿许可证的延续申请工作。公司方面强调,一旦获得相关部门的正式批复,将立即着手恢复生产,确保项目运营的连续性。 尽管采矿许可的暂时中断引发了市场关注...
08:14
2025年8月11日,数据宝最新发布的行业报告显示,近70家医药生物企业积极披露创新药研发进展,涵盖西药、中药及医学诊断等多个细分领域,展现出医药行业蓬勃的创新活力。其中,贝达药业、润都股份等头部企业凭借其前沿的研发成果,成为资本市场关注的焦点。 值得注意的是,截至8月8日,迈威生物-U、百济神州-U等13家医药企业累计接待30家以上机构调研,且融资客增持比...