ChatGPT在全球范围内掀起了AI大模型的浪潮。本文来自微信公众号“自象限原创”(ID:zixiangxian),作者:罗辑,编辑:庄颜,经微新创想授权发布。在美国,以OpenAI、Anthropic等初创企业和微软、Google为代表的科技巨头正引领着AI大模型的发展,最大参数已达到5620亿。在中国,美团王慧文、阿里贾扬清、前搜狗CEO王小川、前京东AI掌门人周伯文等科技大佬纷纷投身其中。AI大模型的发展如烈火烹油,但在这一轮浪潮中,关注点主要集中在中美两国。然而,世界其他国家和地区如何看待AI大模型,在发展大模型上又取得了哪些进展,不同国家和地区的AI大模型发展呈现出哪些特点?这些问题在中美的光环下往往被忽视。俗话说“他山之石,可以攻玉”,在这样的背景下,“自象限”梳理了包括中国、美国、韩国、日本和欧洲等主要国家AI大模型的发展现状。我们发现,一方面,不同国家AI大模型的发展与所在国的互联网发展密切相关;另一方面,芯片、云计算、高质量数据等产业基础,模型架构和算法经验,以及用户群体、社会文化等因素共同决定了所在国家AI大模型的发展高度。正如比尔·盖茨将ChatGPT的发布比作互联网的发明,并认为它可以改变世界一样,英伟达CEO黄仁勋也在GTC2023上三次提到“AI迎来iPhone时刻”。AI大模型是全球的机会,而中国创业者更不应存在视野盲区。将视野拉远便会发现,各国大模型都继承了本国的“基因”,前二十年互联网与科技积累的成果,在AI 2.0的大考下瞬间爆发。有人交了满分答卷,也有人名落孙山。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图

美国:实力雄厚,独占鳌头美国在AI大模型方面的强盛并非一时,而是由来已久。从2012年AI萌芽时期,到2016年AI1.0时期,再到2022年ChatGPT带来的AI2.0时期,美国一直是AI领域的破局者,引领着全球AI发展不断向前。例如,目前几乎所有AI大模型训练时采用的Transformer网络结构,是由谷歌在2017年提出的。Transformer网络结构具有优秀的长序列处理能力、更高的并行计算效率、无需手动设计以及更强的语义表达能力等特征,它让大模型训练成为可能。保证AI大模型出现在美国的另一个关键因素,是美国云大厂和英伟达手握全球算力核心资源。云计算能够为AI大模型训练提供计算、存储、网络和应用平台,同时提供数据处理、模型部署、推理等AI工具和服务,让企业能够快速训练大模型,无需花费大量时间和金钱去建立和维护自己的数据中心。目前,美国拥有世界上最大的云计算企业。IDC数据显示,2021年全球IaaS市场中,亚马逊、微软、谷歌、IBM等美国企业合计占比近70%。而美国最具代表性的AI大模型初创企业,无论是OpenAI还是Anthropic,都接受了微软和谷歌等云大厂的投资。这背后除了资金支持外,更重要的原因还在于背后的云计算资源。算力的另一个维度是芯片,高性能的芯片可以提供更加高效的计算能力,从而加速训练过程。速度有多快呢?2016年,黄仁勋亲手将世界第一台DGX-1(英伟达计算平台)捐献给了OpenAI,DGX-1是3000人花费3年时间才研发出来的首个轻量化的小型超算,计算和吞吐能力相当于250台传统服务器。有了DGX-1,OpenAI之前一年的计算量只要一个月就能完成。而目前为止,英伟达的A100芯片仍然是唯一能够在云端实际执行任务的GPU芯片。最近的GTC2023上,黄仁勋又更新了新芯片H100的进度。H100配有Transformer引擎,可以专门用作处理类似ChatGPT的AI大模型,由其构建的服务器效率是A100的十倍。可以说,在AI大模型领域,目前的美国就是妥妥的“别人家孩子”,这也导致目前行业最具代表性的AI大模型都集中在美国。比如OpenAI最新发布的多模态预训练大模型GPT-4,谷歌最新推出“通才”大模型PaLM-E,拥有世界最大规模的5620亿参数,能看图说话、能操控机器人,以及刚刚解决AI绘画手指问题的Midjourney等等。但在快速发展的过程中,美国业界对于AI大模型也持激进和保守两种不同的态度。其中,微软支持的OpenAI在推动大模型落地时就更加激进。根据OpenAI关于GPT-4的安全文档,OpenAI曾在发布GPT-4前聘请安全专家进行测试。OpenAI在文档中写道:“GPT-4表现出一些特别令人担忧的能力,例如制定和实施长期计划的能力,积累权力和资源(寻求权力),以及表现出越来越‘代理’的行为。”因此有安全专家建议将GPT-4的部署时间推迟6个月,到今年秋季再发布,但OpenAI并没有采纳这份建议。而另一方面,在ChatGPT发布之后,谷歌曾表示自己已经具备相似能力的AI大模型,但基于安全考虑并没有及时推向市场。包括OpenAI创始人Sam Altman和马斯克都曾多次在公开场合表达了对AI大模型和人工智能的担忧,表示应该更谨慎地对待大模型的市场化。目前由谷歌投资的,能够对标OpenAI的另一家AI初创公司Anthropic其实就是因为这样的理念不同,而从OpenAI出走并自立门户。当然,在激烈的市场竞争下,即使曾经相对谨慎的谷歌也似乎忘记了这条担忧,并在3月7日报复性砸出5620亿参数大模型,甚至能够控制机器人运动。目前,以微软和OpenAI为代表,美国AI大模型正在积极推动产业应用。微软早在2月份就宣布将会在全线产品接入ChatGPT,并以几乎一周一个产品的速度向外更新。从New Bing到加入最新功能Copilot的Microsoft Teams正在搅动全球的产业变革。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图1

日本:错失互联网,错失云,错失AI如果说美国是最厉害的大模型“老炮”,那日本可能就要沦为这次排名的“吊车尾”。日本的落后其实要从上个互联网时代讲起。我们盘点世界AI大模型领域的关键角色会发现,无论是中国的BAT,韩国的Naver,还是美国的谷歌、亚马逊,他们都是互联网时代的巨头。一方面,这些企业通过互联网业务积累了大量的高质量数据;另一方面,他们在自身业务推动下建立了完整的云计算体系。但盘点之后我们发现,整个日本既没有叫得出名字的互联网巨头,也没有拿得出手的云计算厂商。目前,日本的即时通讯软件来自韩国的LINE,云计算业务也被美国企业长期把持。2022年,日本云计算市场份额约占全球的4%,排名第四。但日本云计算市场的主要竞争者却是美国的三大云巨头亚马逊、微软和谷歌,它们在日本的市场占有率已经达到60%~70%。除此之外,日本其实还面临许多其他问题,比如由于半导体产业的衰落,让日本在本应成为最大优势的AI芯片领域缺位;比如作为一个小语种国家,日语面临和中文一样缺乏语料的问题。在这样的背景下,日本在AI时代其实早就丧失了自主权。所以我们盘点日本的AI大模型,会发现它们大多具有美国或者韩国色彩。比如日本最早公开上线的NLP大模型是2020年发布的NTELLILINK Back Office NLP,当时它能实现如文档分类、知识阅读理解、自动总结等功能。但NTELLILINK Back Office是在谷歌BERT基础上开发的应用,就像中国许多基于GPT-3开发的应用一样。更有日本血统的生成式AI其实是HyperCLOVA、Rinna 和 ELYZA Pencil,但其中HyperCLOVA 和 Rinna 也都有外国基因。其中,HyperCLOVA最早是韩国搜索巨头NAVER在2021年推出的,其日本版是由NAVER和其子公司LINE(韩国软件在日本经营)一起研发。但HyperCLOVA确实是第一个专门针对日语的大语言模型,其通过爬取日本的博客服务来获取训练数据,并在2021年举行的对话系统现场比赛中获得了所有赛道的第一名。基于HyperCLOVA,LINE也推出许多应用,比如聊天机器人CLOVA Chatbot、图像识别CLOVA OCR和科洛瓦演讲CLOVA Speech等等。HyperCLOVA拥有820亿参数,目前正计划通过超100亿页的日文数据作为学习数据将模型规模扩大到1750亿。日本的另一个AI大模型Rinna则与微软有关,Rinna最早是微软日本研发的一款聊天机器人,类似于国内的小冰(之前叫微软小冰,目前已独立运营)。2021年8月,Rinna发布了一个名为GPT2-medium的模型,然后又在次年推出了日本版的GPT-2,参数达到13亿。日语版GPT-2与GPT-2的区别在于,GPT-2采用的是英文语料,而日语版GPT-2是基于日语语料训练。目前,Rinna的日语版GPT-2和HyperCLOVA已经是日本参数规模最大,最具代表性的大模型了。当然,日本也有一些真正土生土长的大模型,比如2022年3月,由东京大学松尾研究所的AI初创公司ELYZA Co., Ltd.推出大语言模型,它以产品“ELYZA Pencil”的方式推向市场。输入几个关键字,ELYZA Pencil可以在大约6秒内创建三种类型的日语新闻报道、电子邮件或简历。所以算起来,ELYZA Pencil才算真正意义上日本首次公开发布的生成式AI产品,但仅有ELYZA Pencil显然很难成为全村的希望。日本政府其实也在想办法扭转这种局面,比如2022年5月,日本政府计划将云计算服务列为涉及国家安全的“特定重要物资”,并将加强日本本国的“国产云”,但执行下来其实收效甚微。毕竟无论是互联网还是云计算都是规模经济,需要有足够的市场容量才能产生经济效益。这也导致日本互联网和云计算无论是在全球市场,还是在本土市场都缺乏充足的成长空间。但即便如此,日本市场也在积极做着大模型的应用的研究。比如2022年5月,东京大学和Google Brain的一个研究团队发布了论文《Large Language Models are Zero-Shot Reasoners》,解决了大模型0样本学习的部分问题。而在日本的互联网上,日本网友也在积极调用GPT-3的API,尝试开发自己的独特应用。此外,在刚刚举行的英伟达GTC 2023上,英伟达与日本三菱联合打造了日本第一台用于加速药研的生成式AI超级计算机。

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图2

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图3

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图4

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图5

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图6

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图7

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图8

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图9

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图10

ChatGPT浪潮下各国AI大模型现状:中美领跑,日韩差异解析插图11

最新快讯

2025年11月23日

00:09
2025年11月22日,宾利汽车以创新科技重新定义奢华体验,正式推出支持定制动画的迎宾灯光系统。这项前沿技术允许客户自由创作最长11秒的独特动画效果,为每一次出行注入个性化魅力。据悉,该技术首次亮相于在罗马尼亚雅典娜神庙举办的特别活动中,通过车门下方精密投影装置,为宾客呈现令人惊叹的光影艺术。 该系统采用尖端光学设计,集成了三色光源、五个高精度镜头、两个特殊...

2025年11月22日

23:32
微新创想11月22日讯 谷歌近日震撼发布全新Gemini3系列大模型,凭借卓越性能强势超越OpenAI,成为当前AI领域的顶尖力量,其影响力更推动谷歌股价实现历史性飞跃。Gemini 3系列的崛起,离不开谷歌自研TPU生态的强大支撑,这一技术壁垒为谷歌在AI领域的持续领先奠定了坚实基础。展望未来,若想保持Gemini 4的领先地位,谷歌必须进一步强化算力基础...
23:32
近日,航天技术领域传来重大进展,Axiom Space与KBR公司成功联手完成了一项关键性的新型舱外机动单元航天服测试。此次测试的核心目标是为NASA备受瞩目的“阿尔忒弥斯”重返月球计划提供坚实的技术支撑。整个测试过程在模拟真空环境下严谨进行,重点聚焦于航天服在极端环境下的热性能表现以及先进材料的实际应用效果。 据研究员Russell Ralston透露,本...
23:32
2025年11月25日至12月2日,《战地6》将开启为期一周的盛大免费试玩活动,为广大玩家提供深度体验的机会。本次试玩内容丰富多样,涵盖征服、突破、破坏、团队死斗以及一种神秘未公布模式,让玩家可以在“东方木林”“布莱克韦尔农场”“开罗围城”三张精心设计的地图中尽情探索。这三张地图各具特色,从紧张刺激的战场到充满策略的据点争夺,将为玩家带来全方位的游戏体验。 ...
22:58
微新创想11月22日讯 小米集团于当晚隆重举办小米17与澎湃OS3庆功盛典,以"软硬融合 共赴巅峰"为主题,向全球用户展示其创新成果。卢伟冰在社交媒体上分享的菜单细节,堪称一场精心策划的感官盛宴,从"澎湃启航"到"卓越并肩",四个篇章精心呈现了18道精致菜品及各式主食水果,每道菜名均巧妙融入"初心"、"希望"、"开拓"等关键词,将产品理念巧妙地编织在宴席的每...
22:58
微新创想11月22日重磅消息,知名科技博主罗永浩在最新一期《罗永浩的十字路口》播客节目中,首次公开透露了锤子科技濒临倒闭时的关键决策。他坦言,若没有推出备受争议的TNT项目,锤子科技或许能多存活数年。罗永浩回忆道,当时他并不满足于传统的产品迭代,渴望进行颠覆性的创新,正是这种雄心壮志催生了TNT项目。 在节目中,罗永浩详细阐述了TNT项目的初衷和愿景。他认为...
22:58
微新创想11月22日重磅消息,知名分析师Jeff Pu在其最新发布的研究报告中透露,苹果将推出全新iPhone 17e机型,计划于2026年第一季度中期正式发售。相较于前代iPhone 16e,iPhone 17e最引人注目的核心升级在于搭载了前置1800万像素摄像头,该配置与万元旗舰iPhone 17 Pro Max看齐,预示着苹果在移动影像领域的再次突破...
22:58
微新创想11月22日讯 近期,百川智能创始人王小川在一场重要活动上发表了一场引人深思的主题演讲。在回顾自身职业发展历程的同时,他也清晰阐述了未来的宏伟愿景。他坦诚地表示,早在2021年将公司出售给腾讯时,告别信中便已明确写下自己的梦想——生命科学与大健康领域。面对外界的疑问,他强调自己并非在寻找方向,而是早已目标明确,只是在等待技术的成熟。"当时的技术尚未...
22:58
小米汽车安全技术再获突破 微新创想11月22日重磅消息 中国汽研权威发布的四大安全辅助功能测试中 小米YU7紧急转向辅助系统(AES)以全项通过的成绩惊艳亮相 董事长雷军亲自宣布这一里程碑式成果 就在前一天 小米创始人 首席执行官雷军公开表示 中国汽研组织的四大安全辅助功能测试中 小米AES紧急转向辅助功能已全部成功通过 这标志着小米汽车在智能驾驶安全领...
22:58
11月22日最新消息,河南一位女子近日在网上分享了一则令人惊叹的经历:她的丈夫仅用8万元人民币,成功拍下了一套位于威海乳山的70平米海景房,迅速引发全网热议。据女子详细描述,其丈夫偶然在某知名网络拍卖平台上发现了一套位于威海乳山的海景房,令人意外的是起拍价仅为1111元。在看到如此低廉的价格后,丈夫一时冲动缴纳了保证金,开启了一场惊心动魄的竞拍之旅。 起拍后...
22:58
2025年广州国际车展盛大启幕,212越野车携全新力作T01高地版震撼登场,官方指导价定格于20.58万元。这款硬核越野利器精准定位于"全地形战士",专为户外探险、长途穿越等极限场景量身打造,以强悍性能征服各种复杂路况。 外观设计上,T01高地版采用极具辨识度的"晨曦金"车身配色,搭配独特的高地纹理设计,彰显硬朗气质。细节处彰显专业越野基因:配备加厚防滑...
22:58
2025年11月22日,铭凡正式发布了备受瞩目的MS-02 Ultra迷你工作站,这款创新产品以惊人的4.8升紧凑体积,重新定义了高性能计算设备的界限。作为行业首款真正意义上的微型工作站,MS-02 Ultra不仅集成了尖端硬件配置,更在空间利用和性能释放上实现了完美平衡,为专业用户和小型办公环境提供了前所未有的解决方案。 这款迷你工作站的核心配置堪称顶级—...