编者按:本文源自微信公众号科技新知(ID:kejixinzhi),作者古廿,编辑伊页,经微新创想授权转载。”过去的成绩无法预测未来”——这句金融理财模型中的小字注解,在产品业务领域被称为模型漂移、衰退或过时。环境变化会导致模型性能随时间下降,最终衡量标准是模型质量指标,如准确率、平均错误率或下游业务KPI(如点击率)。没有模型能永远有效,但衰退速度各异。某些产品可使用多年无需更新,如特定计算机视觉或语言模型,或是在稳定环境中的决策系统(如实验条件)。要维持模型精度,需持续用新数据训练,这是机器学习模型的固有缺陷,也使人工智能部署无法像传统软件那样一劳永逸。几十年的软件技术仍在支撑最先进的AI产品,即便技术已过时。然而,以ChatGPT为代表的大模型,在人气下滑后面临是否过时和衰老的质疑。用户在ChatGPT上的停留时间从3月的8.7分钟降至8月的7分钟,反映大模型工具供给激增时,仅作为生产力工具的ChatGPT难以满足Z世代主流需求。人气虽不能动摇OpenAI的AI应用商店地位,但ChatGPT生产力的老化正削弱老用户的信任。自5月起,OpenAI论坛持续发酵GPT-4性能不如往昔的讨论。那么,ChatGPT是否过时了?以它为代表的大模型会像传统机器学习模型一样衰老吗?不解答这些问题,就难以在大模型热潮中找到人与机器的可持续发展路径。

01 ChatGPT过时了吗?
Salesforce最新数据显示,67%的大模型使用者为Z世代或千禧一代,而很少使用生成AI的人群中68%以上是X一代或婴儿潮一代。代际差异表明Z世代正成为大模型主流用户。Salesforce产品营销人员Kelly Eliyahu指出:”Z世代是AI一代,构成超级用户群体,70%使用生成式AI,至少一半每周或更频繁使用。”但作为大模型领军者,ChatGPT在Z世代中的表现平平。Similarweb7月数据显示,ChatGPT在Z世代中的使用率从4月的30%降至27%,远低于Character.ai在18-24岁人群中的60%渗透率。后者通过个性化定制和UGC功能(如苏格拉底、God等虚拟角色)满足Z世代需求,其iOS和Android应用月活用户达420万,逼近ChatGPT的600万。收购Global Illumination或预示OpenAI将丰富大模型数字体验。02人工智能的衰老化
ChatGPT在大模型体验层面的老化削弱了其用户粘性。作为生产力工具,其生成结果的不稳定性正导致信任度下降。Salesforce调查显示,近六成用户认为需长期使用才能掌握大模型技术,但技术掌握随时间变化。5月OpenAI论坛开始出现GPT-4″在熟悉任务上表现不佳”的抱怨。《Business Insider》7月报道称,老用户将GPT-4形容为”懒惰””愚笨”,主流猜测指向成本优化导致性能下降,但OpenAI否认使用小模型。斯坦福与伯克利大学7月研究显示,同一版本大模型(GPT-3.5/4)在3月至6月间数学能力(如质数识别)、敏感问题回答意愿、代码生成等任务上表现波动。麻省理工学院等机构2022年研究指出,91%机器学习模型会随时间退化,这种现象被称为”人工智能老化”。例如Google Health开发的视网膜疾病检测模型,实验室准确率达90%却无法实际应用,因训练数据质量远高于现实扫描质量。传统AI以单一语音识别技术为主,而大模型智能涌现能力的突破使其逐渐走出实验室。但涌现能力的黑盒特性仍引发对ChatGPT能否持续提升性能的质疑。03黑盒下的抗衰老性
人工智能老化的本质是机器学习模型的范式缺陷。传统模型通过大量示例训练对应关系,需频繁更新以应对新任务或数据变化,导致旧功能失效。以ChatGPT为代表的大模型突破此范式,通过”教”数据而非”模仿”数据实现理解,理论上可永葆青春。但从业人士指出,大模型智能涌现的非线性、不可预测性使其同样面临衰老风险。百川智能Baichuan2发布会上,张钹院士坦言:”全世界对大模型原理仍一知半解,所谓涌现只是解释不清的退路。”ChatGPT生成的外部驱动语言与人类自意图驱动的自然语言存在根本差异,导致内容正确性与合理性难保证。对生产力模型而言,挑战在于持续保证可靠性与准确性;对娱乐产品(如Character.ai)而言,正如联合创始人Noam Shazeer所言:”系统为合理对话而设计,而非真相。”大模型浪潮已分流应用方向,参考资料:Gizmodo-Is ChatGPT Getting Worse?TechCrunch-Al app Character.ai is catching up to ChatGPT in the USMachine Learning Monitoring- Why You Should Care About Data and Concept DriftM小姐沿习录-关于ChatGPT的五个最重要问题清华大学人工智能国际治理研究院-对大模型的研究很迫切,不能解释不清楚就说”涌现”本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年10月29日

06:27
10月29日清晨至上午时段,我国多个地区将遭遇大雾天气的困扰。北京、天津、河北、陕西、河南、山东、湖北、湖南、贵州等省份的部分区域将受到大雾影响,其中北京南部、天津北部、河北中南部以及河南北部等地雾气尤为严重,能见度将降至500米以下,局部地区甚至不足200米,对出行造成极大不便。 中央气象台已于当日凌晨6时正式发布大雾黄色预警,提醒广大公众尽量避免晨间户外...
05:57
2025年10月29日,科技巨头苹果公司正式揭晓了其产品线的重大升级计划,宣布将MacBook Air和iPad系列产品的显示屏技术进行全面革新。据行业消息透露,苹果将借鉴iPhone的成功经验,引入先进的OLED显示屏技术,旨在为用户带来前所未有的视觉盛宴。此次升级不仅限于iPad Pro,更涵盖了包括iPad mini在内的多款热门型号,预示着苹果正逐步...
05:24
2025年10月28日,美国股市上演了一场鲜明的板块分化行情。在整体市场波动中,科技板块异军突起,成为当日表现最亮眼的板块。全球科技股指数ETF逆势上涨1.38%,展现出强劲的增长动力。细分领域同样表现不俗,科技行业ETF上涨0.99%,半导体ETF更是录得0.88%的涨幅,显示出市场对科技股的持续看好。特别是在标普500指数中,信息技术板块涨幅高达1.64...
05:24
诺基亚首席执行官Patrik Hotard近日公开强调,公司与全球知名科技巨头英伟达的战略合作将共同开启无线通信技术的创新纪元。双方将强强联手,聚焦于人工智能驱动的无线网络解决方案研发,致力于加速6G技术的商业化进程。根据规划,这项具有里程碑意义的合作产品预计在2027年实现全球范围内的全面商业化部署,而首批客户的试点测试计划将于2026年初正式启动。 此次...
05:24
2025年10月29日,全球知名食品饮料公司亿滋国际正式发布最新业绩指引,宣布将全年有机净营收增长预期从原先的5%下调至约4%。这一调整主要受到两大因素影响:部分核心市场的消费需求出现放缓迹象,以及全球汇率波动带来的不利冲击。尽管面临外部环境挑战,亿滋国际强调其核心品牌在亚太、欧洲等多个关键区域依然展现出强劲的市场韧性,持续保持稳健增长态势。为应对当前复杂的...
04:52
苹果公司于今日正式向全球iPhone和iPad用户推送了iOS/iPadOS 18.7.2 RC(Release Candidate)版本更新,其内部版本号为22H123。此次更新距离上一个测试版本发布已过去了整整49天,充分展现了苹果在软件迭代方面的严谨与高效。对于广大果粉而言,这是一个不容错过的系统优化机会。 想要升级至最新测试版系统的用户,主要有两种途...
04:52
苹果公司于今日正式向iPhone和iPad用户推送了备受期待的iOS/iPadOS 26.1 RC测试版更新,内部版本号为23B82。此次更新距离上一轮测试版发布仅相隔8天,充分展现了苹果公司快速迭代和精益求精的开发节奏。用户可以通过两种途径参与本次系统升级体验:对于公开测试版,用户需要提前注册Apple Beta版软件计划,并在系统设置中手动开启Beta版...
04:52
苹果公司今日正式向Mac用户发布了macOS 26.1 RC更新,其内部版本号为25B77。值得注意的是,距离上一轮Beta/RC版本发布仅过去了短短8天,这一密集的更新节奏充分展现了系统优化已进入关键冲刺阶段。从历史发布记录来看,macOS 26系列自今年6月启动测试以来,已经经历了多轮次的迭代与调试,而近期的工作重点则明显转向了系统稳定性的全面提升。 本...
04:52
苹果公司近日向Vision Pro用户正式发布visionOS 26.1 RC版本更新,内部版本号为23N48。此次更新仅距离上一个测试版本发布8天,彰显了苹果在空间计算系统开发上的惊人速度。根据官方更新日志,由于全球服务器节点配置存在差异,部分地区用户可能会遇到更新时间延迟,但通常不会超过半小时。从版本发布历史来看,visionOS 26自今年6月启动测试...
04:52
苹果公司今日正式向全球Apple Watch用户推送了备受期待的watchOS 26.1 RC版本(内部版本号为23S36),这一重要更新标志着该操作系统距离最终正式发布仅一步之遥。值得注意的是,此次RC版本的发布距离上一轮Beta/RC版本仅相隔8天,这一紧凑的更新周期清晰地反映出苹果在系统开发方面的节奏已趋于稳定,预示着后续版本迭代将更加高效有序。 回顾...
04:21
2025年10月29日,在华盛顿GTC全球科技大会上,英伟达CEO黄仁勋发表了掷地有声的演讲,有力驳斥了当时甚嚣尘上的AI泡沫论。他不仅描绘了英伟达未来的宏伟蓝图,更透露了公司最新研发的Blackwell芯片及Rubin模型将在未来五个季度内创造高达5000亿美元收入的惊人目标。 大会上,英伟达展示了与优步、Palantir和CrowdStrike等知名...
03:44
2025年10月29日,微软正式宣布将在Azure云平台率先推出搭载NVIDIA RTX Pro 6000 Blackwell服务器版GPU的尖端计算服务。这一创新举措专为提升人工智能与高性能计算能力而设计,将全面面向企业客户开放使用。该服务的推出不仅彰显了微软与NVIDIA在AI基础设施领域的深度战略合作,更预示着Azure将在全球云计算市场迎来新的竞争优...