之前看GPT-4像乔峰,武功盖世,现在看GPT-4像慕容复,浪得虚名。

编者按:本文来自微信公众号数字力场(ID:shuzilichang),作者:佘宗明,微新创想经授权转载。

发现没,好像没什么人再吹GPT-4了。料到了它的热度会降下来,不降对不起Gartner曲线,但没想到是断崖式下降。要知道,110多天前,作为ChatGPT进化版的GPT-4刚问世时,很多人还被它能1秒生成网站、解答逻辑题、调侃脑筋急转弯的能力惊到了。那时候,国人的反应通常包括几点:先是震惊,“真是牛逼Plus”。后是担心,“差距又拉大了”。接着是觉得自己想象力已经不够用了:按照GPT这一日千里的进化速度,GPT-5出来后,是不是得宣告大结局了?

尽管今天舆论谈到GPT时习惯提ChatGPT,但GPT-4其实是更强大的存在。“皮衣刀客”黄仁勋就说:GPT-4的厉害之处,OpenAI也没说清楚。360创始人周鸿祎则是将GPT-4视作“通用人工智能的奇点和强人工智能到来的拐点”。“硅基取代碳基”的话题,也被GPT-4的史诗级进化带入舆论场。包括马斯克跟AI教父Bengio在内的上千名科技行业人士,没多久后还联名发公开信,呼吁暂停强AI的研发。

马斯克等上千名科技人士此前曾发联名公开信,呼吁为强AI研发摁暂停键。一股担心科技大爆炸引发社会大震荡的流行情绪,在全球蔓延开来。可现在呢,你跟许多人说GPT-4,他没准会回你:GPT什么?G什么4?什么PT4?你说:行,你先凉快着吧。他说“好嘞”,尔后继续刷普里戈任或蔡徐坤。天空响了一道惊雷,但风暴雨并没有来。

GPT-4热度骤降:从巅峰乔峰到被质疑的慕容复插图

何止是GPT-4,就连ChatGPT和背后的OpenAI公司,都在“增长放缓”的判断和“这轮AI见顶了吗”的分析中,显得有些黯淡失色。以前上热搜,指向的都是ChatGPT厉害炸了。而今成热门,画风早已大变——图灵奖得主杨立昆炮轰ChatGPT:五年内就没人用了。马斯克为了不再被ChatGPT白嫖,决定给Twitter“上锁”。ChatGPT凉了?6月访问量环比下滑近10%。OpenAI遭集体诉讼,明星大模型变“数据小偷”?已经有媒体开始严肃讨论:GPT,是吹起来的泡沫吗?

01

之前看GPT-4像乔峰,武功盖世。现在看GPT-4像慕容复,浪得虚名。这似乎又是个“初看是王者,再看是青铜”的副本。问题来了:现有的大模型天花板GPT-4,已经不香了吗?看上去,确实是这样。就在上个月,“GPT-4变笨”的话题,一度在国外技术社区内引发热议。有用户反馈,把GPT-4的3小时25条对话额度一口气用完了,都没能解决自己的代码问题,切换到ChatGPT基于的GPT-3.5版本,反倒把事情解决了。他反馈的主要问题包括:以前GPT-4能写对的代码,现在满是Bug;回答问题的深度分析变少了,内容质量变差了。这引起网友们的共鸣,“GPT-4开倒车”的说法由此兴起。不少网友都怀疑,GPT-4会像微软必应那样,出道即巅峰,但后来惨遭“前额叶切除”。

深度学习框架Keras创始人、网红科学家François Chollet,为GPT-4“自干五”地洗道:不是GPT的表现变差,而是大家渡过了最初的惊喜期,对它的期待变高了。言下之意,是高期待值拉高了人们对GPT失误的敏感度。但OpenAI开发者推广大使Logan Kilpatrick,倒是挺会自我拆台——很显然,OpenAI开发者推广大使是个耿直Boy。网友问他,GPT-4大模型本体自从3月14日发布以来都是静态的,对吧?他说,没错。网友又问他,相同提示词回答不一致,是因为大模型本身不稳定吗?他又回答,Yes。回答得这么坦诚,一看就是没好好学习胡锡进的讲话艺术:近期网上出现了××,老罗也看到××,知道大家很××,老罗忍不住啰嗦几句,虽然××确实存在××,但是××……

02

GPT-4热度骤降:从巅峰乔峰到被质疑的慕容复插图1

GPT-4变“弱”了,国内科技大佬的“大模型自信”也就变强了。几个月前,国内外AI大模型存在代差,几乎是共识,歧异只在于差距到底有多大。今年3月25日,周鸿祎曾表示,中国大语言模型和GPT-4差距在两三年。5月上旬,周鸿祎跟俞敏洪对谈,谈到ChatGPT问题时说,“如果不经过两年的模仿和抄袭,上来就说自己能超越,那才叫吹牛呢。”几天后,做客央视节目时又说:GPT-4有强大的思维链模型,能够把一个事情做连续多步推理,能够把一个目标做多任务的分解和规划。如果要跟这种能力去比,国内大模型引擎跟它比都是六七十分的水平,差距可能是两年,“如果有人说差两个月、差两周我可能不太相信”。华为原副总裁张俊对此大概颇为认同,他5月下旬接受采访时也说,国内外AI大模型存在约两年的代差。而李彦宏被王小川怼,也是因为他3月下旬接受专访时提了一嘴“文心一言和ChatGPT的水平差了2个月,但可以追赶”。在王小川看来,这属于自我吹嘘,“怎么可能只差2个月?”“之前如果说追上GPT3.5用一年还是有可能的,但是目前OpenAI已经训练到GPT-4的级别,GPT-5也在训练过程当中,我们追上还需要三年。”就连李彦宏之后都给自己找补,说自己是被断章取义了。彼时的共识就是:AI大模型的进化是非线性的,其正向增强回路的特点会强化“强者愈强”的头部效应,外加语料库质量差异,国内外AI大模型可能会越拉越大。

但近段时间,某些大佬的口径在变。科大讯飞董事长刘庆峰就很自信。在5月6日的讯飞星火认知大模型发布会上,刘庆峰表示,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他还扬言:10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。周鸿祎也不遑多让:6月8日,跟品玩创始人骆轶航对话时,他说,最近几个月国内同行陆陆续续发布了自己的大模型,虽然客观来讲跟GPT4.0还有点差距,相比GPT3.5也有点差距,但差距没有那么大。在5天后的360智脑大模型发布会上,他更是表示,国内大模型已基本赶上或接近国际先进水平,之前曾说和全球先进的差距有一两年,今天收回这句话。中国工程院院士邬贺铨在6月下旬接受采访时也说,评价大模型水平应该是多维度的,全面性、合理性、使用便捷性、响应速度、成本、能效等,笼统地说目前我国大模型开发与国外的差距为1—2年的依据还不清楚,现在下这一结论意义也不大。他还指出,按2022年年底的数据,美国占全球算力36%,中国占31%,现有算力总规模与美国相比有差距但不大,而以GPU和NPU为主的智能算力规模中,中国明显高于美国(按2021年年底数据,美国智算规模占全球智算总规模15%,中国占26%)。

03

所以,GPT-4是被吹得太狠了吗?这两天的两则新闻,或许挺适合对此作答:阿里达摩院多语言NLP团队日前发布了首个多语言多模态测试基准M3Exam,共涵盖12317道题目,结果显示,多语言能力上,GPT-4是唯一一个可以超过60%准确率的模型,其他的均不及格。麻省理工学院和微软的学者近来的研究也发现,GPT-4在自修复方面表现出了有效能力,GPT-3.5则没有。在此之外,GPT-4还能够对GPT-3.5生成的代码提供反馈。那为什么很多人感觉GPT-4能力退化了?微软研究院早前刷屏的那篇论文《AGI的火花:GPT-4早期试验》中的说法,兴许可资参考:微软方面获得的GPT-4版本性能,要远强于目前的公测版本。公测版本变弱,是因为它要对标人类的指令和价值观。说大白话就是:OpenAI也怕出安全问题,所以“宁可变慢一点,也要安全一些”。

有人会说:不重要了,没看到人家访问量正在下滑吗?访问量下滑,确实是不少人评价ChatGPT们“涨不动了”“也不行了”的重要依据。乍看起来,这不乏数据支撑:多家数据分析网站指出,ChatGPT的访问量环比增长率已从1月份的131.6%、2月份的62.5%、3月份的55.8%、4月份的12.6%,跌到了5月份的2.8%,6月份或环比下降。

GPT-4热度骤降:从巅峰乔峰到被质疑的慕容复插图2

统计显示,ChatGPT的访问量增速出现回落态势。OpenAI麾下的ChatGPT和GPT-4告别流量高增长时代,大概率是事实。但别忘了几点潜在背景:1,OpenAI未必在乎C端用户直接访问官网的流量,因为它不像跟B端客户抢用户。OpenAI的CEO阿尔特曼就曾表示,ChatGPT未来的核心战略使命,是吸引更多的企业应用程序接入API,而非在C端,与自己的企业客户争夺流量。OpenAI从3月初开始,就在降价token的费用,借此鼓励更多第三方开发者(很多都是B端客户)使用ChatGPT和Whisper工具,通过API接口整合接入他们的服务。现实中,很多人访问的都是那些应用插件,而不是OpenAI官网。这难免对ChatGPT和GPT-4造成分流,但那些统计工具并未顾及这层因素。2,4月初ChatGPT曾出现大面积封号,主要针对“特制工具”批量注册的黑账号。来自东方的神秘力量们凭着VPN和黑科技贡献的流量,就被切掉了。所以,你说它的流量下滑没毛病,但这未必是OpenAI最在意的。

04

不论是GPT-4貌似没那么“灵”了,还是ChatGPT和GPT-4访问量下滑了,都指向了一点:大模型的正确打开方式,与其说是做流量入口,不如说是深入行业场景,做行业数字化的AI底座。从网络反馈看,反映GPT-4变笨了的,主要都是些细分行业从业者。他们想要的业务知识,确实是那些基础性、普适型的公用大模型给不了的。OpenAI要把自身从C端爆火的超级AI应用,变成并不性感的API接口服务平台,说白了,就是想将价值做深,而不是只赚流量钱。

为什么阿里云的通义千问今年4月发布后,想要通过“伙伴计划”撬动更多企业在再训练和精调基础上打造企业的专属大模型?为什么周鸿祎说“公有大模型在落地政府、城市、行业和企业场景时并不能直接使用,存在着缺乏行业深度、易带来数据安全隐患、无法保障内容真正可信及无法实现成本可控四大痛点”,企业级垂直大模型才是未来?为什么腾讯云6月19日不是直接发布基础的通用大模型,而是发布面向B端客户的MaaS(模型即服务)服务解决方案,帮金融、政府、文旅、传媒、教育等行业打造契合自身业务需要的“专属模型”?原因就在于:AI大模型是工业革命级的生产力工具,最终得服务于生产效率提升,是以还得将B端作为切入口。唯有如此,才能在AI时代“把所有行业重做一遍”。

前些天,傅盛PK朱啸虎,围绕ChatGPT激辩,核心也在于类ChatGPT产品的价值点开掘上。作为创投圈话题人物的朱啸虎,认为ChatGPT对创业者不友好,只有大厂商才玩得转大模型,大模型都是在大模型上做应用又没什么价值,完全没有BAT级机会。曾跟周鸿祎、雷军、马化腾、马云等一众大佬相爱相杀的猎豹创始人傅盛,则认为大模型催生了很多新的架构在大模型之上的创业机会,包括直接在大模型上搭建的不同应用和由于数据私有带来的垂直领域大模型等。可以这么理解:朱啸虎认为,创业公司们很难复制OpenAI,压根就没做通用AI时代的Windows或安卓系统的机会。傅盛则不以为然,认为做AI时代的美团滴滴也挺好——美团滴滴们不就是靠拿捏住落地场景做大的吗?

GPT-4热度骤降:从巅峰乔峰到被质疑的慕容复插图3

05

说回GPT-4,再怎么说它变弱了,它依旧是霸榜级别的存在。打个不甚恰当的比方,GPT-4就是大模型版NBA里巅峰期还没过去的詹姆斯,它身后的Bard、LLaMA、文心一言、通义千问等,就相当于字母哥、杜兰特、库里、约基奇,仍在追赶。詹姆斯未必是“永远的神”(华语乐坛这么多年了“永远的神”也只有华晨宇一个),但在其鼎盛期,他的实力是独一档。至于OpenAI的GPT以后会不会走下坡路,就难以料定了。就目前看,中国大模型的追赶之路仍然道阻且长。特别是考虑到美国预计7月份针对对华芯片出口实施新管制,连英伟达为中国特供的A100平替版GPU芯片A800都要禁,加速追赶正迎来更多高难度挑战。

但不能说中国大模型就没机会。中国互联网过去20年能弯道超车,成为全球Top2的玩家,超大市场提供的海量应用场景就是个重要因素。中国消费互联网规模能做成全球第一,就得益于互联网平台们抓住了应用场景里蕴藏的机会,进而不断做大。到了大模型时代,国产大模型很难再做出ChatGPT那种一问世就举世瞩目的大模型产品了,毕竟喝头啖汤有身位优势。可它们能不能立足于应用场景,在助益实体产业中发掘出更多“平台级”机会来,还挺值得观察。能,就会得到市场的犒赏。

说到底,GPT-4有没有从北乔峰变南慕容,固然挺有说头。但反求诸己,更重要的,还是练好“适合自身体质”的武功秘笈。不然的话,连进AI江湖“五绝”的机会都没。

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年10月02日

21:27
特斯拉最新公布的季度交付报告揭示了一幅令人瞩目的市场图景。2025年第三季度,公司全球范围内共交付汽车497,099辆,这一数字不仅远超市场机构此前预测的439,612辆,更实现了7.3%的同比增长。与2024年同期463,000辆的交付量相比,特斯拉展现出持续稳健的增长态势,彰显出其强大的市场竞争力。 在车型结构方面,Model 3和Model Y的交付量...
21:27
OPPO CLUB中国首店于10月1日盛大入驻深圳湾万象城,以“科技与人文共绘城市青年漫游地”为核心定位,打造集前沿科技与潮流文化于一体的独特体验空间。店内精选融合科技元素与时尚设计的单品,为会员提供专属权益与增值服务,让每一次购物都成为探索科技与艺术的旅程。 该门店巧妙结合深圳湾的城市特色,定制主题空间设计,通过沉浸式场景强化俱乐部式体验,让消费者在享...
21:27
声桥AI近日传来振奋人心的消息,成功完成数百万人民币的天使轮融资,其中东方富海作为领投方展现出对创新项目的坚定信心,同时也有部分知名个人投资者积极参与跟投。这家专注于AI口语康复领域的科技公司,正凭借其前沿技术为听障人群带来福音。 声桥AI的核心产品巧妙融合了大模型与语音识别技术,开创了言语康复领域的新局面。面对国内千万听障人士尚未获得有效康复服务的现状,该...
21:27
近日,国内领先的新能源电池行业数字化服务商储慧智能正式宣布成功完成A轮融资,本轮由知名投资机构武岳峰科创领投。作为业内专注于电池领域数字化转型的创新企业,储慧智能自创立以来始终坚持以自主研发为核心驱动力,已成功构建起一套完整且拥有自主知识产权的数字化产品体系。该体系深度整合大数据技术与工业软件,为电池制造商提供全方位的数字化解决方案。 储慧智能通过自主研发的...
21:27
近日,国内雕刻机及精密模具行业的领军企业——北京精雕集团正式宣布成功完成B+轮融资,投资方由元禾控股与北京国管投资联合领投。作为一家集研发创新、生产制造、市场营销及专业服务于一体的全产业链企业,精雕集团凭借其卓越的技术实力和市场口碑,在行业内树立了标杆地位。其业务版图广泛覆盖数控机床、智能数控系统、CAD/CAM软件解决方案以及高速精密电主轴等核心领域,为精...
21:27
雷擎科技近日传来振奋人心的消息,成功完成B+轮融资,投资方为粤科金融投资。作为国内低空防御领域的领军企业,雷擎科技专注于为“低、慢、小”的民用无人机安全挑战提供综合解决方案。面对日益严峻的低空空域安全形势,雷擎科技凭借其创新技术和专业团队,致力于构建全方位的反制体系。 公司核心产品无人机导航诱骗系统,能够精准识别并干扰无人机信号,有效阻止非法入侵行为。此外,...
21:27
近日,国内无人机领域领军企业中科云图正式宣布成功完成C轮战略融资,本轮由广州产业投资基金与海珠城发集团联合领投。作为专注于无人机综合应用服务的高新技术企业,中科云图凭借其领先的行业地位,此次融资将为其持续创新注入强劲动力。 中科云图长期致力于无人机智能操作系统的研发与突破,通过整合遥感数据采集技术和航空影像处理技术,构建了完善的智能化解决方案体系。公司业务覆...
21:27
在刚刚结束的Welt AI峰会上,OpenAI首席执行官萨姆・奥尔特曼发表了令人瞩目的演讲,他深刻指出人类与计算机的交互方式仅经历过两次重大革命——从鼠标键盘到图形界面,而人工智能技术的潜力却远未得到充分释放。奥尔特曼强调,目前市面上还没有专门为"AI世界"量身打造的计算机设备,但OpenAI已经开始积极布局硬件研发领域,致力于通过技术创新彻底重塑人们的工作...
21:27
艾语智能近日传来振奋人心的消息,成功完成A轮融资,投资方包括北洋海棠、风投侠和尚势资本联合加持。作为个人无抵押信贷资产处置领域的创新先锋,艾语智能凭借其前瞻性的技术布局,正引领行业变革浪潮。 公司推出的"阿亮个贷纾困机器人"是业内首款全流程智能化处置解决方案,通过深度替代传统人工操作,彻底打破效率瓶颈。在技术架构上,艾语智能基于业界领先的开源模型进行系统性微...
21:27
近日,专注于低轨卫星通信产品研发的创智联恒成功完成B+轮融资,投资方为知名风险投资机构北创投。作为一家高新技术企业,创智联恒始终以卫星互联网为核心业务,通过持续的技术创新,已成功构建起覆盖端到端的星地通信系列产品及技术解决方案体系。 创智联恒的技术研发实力突出,其产品广泛应用于偏远地区通信、灾害应急响应、航空航天探索以及远洋海事等多个关键领域。通过不断优...
20:25
2025年10月2日,OpenAI迎来历史性时刻,成功完成约66亿美元的股份转让,这一壮举使其估值飙升至令人惊叹的5000亿美元,正式跻身全球最贵初创公司的行列。这一里程碑不仅彰显了OpenAI在人工智能领域的卓越成就,更预示着AI技术的无限潜能与广阔前景。 在战略布局方面,OpenAI宣布与日本数字厅达成深度战略合作,双方将携手推动AI技术在公共领域的创新...
20:25
在汽车行业经历深刻变革的浪潮中,极氪凭借自主研发的尖端技术成功突破了传统豪华车市场的壁垒。该品牌推出的极氪9X车型采用不计成本的研发模式,搭载了1400匹马力的三电机混动电驱系统,其动力表现堪比顶级超跑,为消费者带来了前所未有的驾驶体验。 极氪9X的突破性进展不仅体现在动力系统上,更在于其与宁德时代联合研发的900V混动专用电池。这一创新技术使得该车型实...