人类创作的文本始终比AI生成的文本更具价值。随着GPT-4、Stable Diffusion和Midjourney等生成式AI技术的迅速崛起,越来越多的人开始将其融入工作和生活。甚至有研究者尝试利用AI生成的数据来训练新的AI模型,试图打造所谓的「数据永动机」。然而,牛津大学、剑桥大学和帝国理工学院等顶尖机构的研究人员发现,如果在训练过程中过度依赖AI内容,会导致模型出现灾难性的「模型崩溃」,造成不可逆转的缺陷。这意味着,随着时间的推移,AI模型会逐渐遗忘真实的基础数据。即使在理想的长期学习环境下,这一问题也无法避免。因此,研究人员强烈呼吁,为了维持大规模数据训练带来的模型优势,必须重视人类原创文本的价值。相关研究论文可查阅:https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图

然而,现实情况更为复杂——你以为的「人类数据」,可能并非完全由人类创作。洛桑联邦理工学院(EPFL)的最新研究表明,高达33%-46%的人类数据实际上是由AI生成的。这意味着,当前训练AI模型所依赖的数据中,相当一部分是「垃圾数据」。尽管GPT-4等大语言模型已展现出惊人的文本生成能力,能够模仿人类写作风格,但它们的训练数据主要源自过去几十年互联网上的公开交流。如果未来模型继续依赖网络爬取,不可避免地会纳入自身生成的文本,从而加剧模型崩溃的风险。研究人员预测,随着GPT系列的迭代发展,这一问题将日益严重。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图1

在这种背景下,为AI模型准备高质量的人类原创数据变得至关重要。亚马逊的Mechanical Turk(MTurk)自2005年上线以来,已成为许多人的兼职选择。科研人员通过MTurk发布各种需要人类智能的任务,如图像标注、问卷调查等,这些任务往往难以通过计算机算法完成。MTurk也因此成为预算有限的科研人员和企业的「优选方案」,就连贝佐斯曾戏称其为「人工人工智能」。除了MTurk,Prolific等众包平台也已成为研究者和行业实践者的核心数据来源,提供创建、标注和总结各类数据的方法。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图2

但EPFL的研究揭示了一个令人担忧的事实:在这些关键的人类数据来源中,近半数内容是由标注员使用AI工具生成的。相关论文链接:https://arxiv.org/abs/2306.07899v1

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图3

「模型崩溃」是指当AI模型被大量AI生成数据「喂养」后,会出现的跨代退化现象。具体来说,新一代模型的训练数据会被前代模型的生成内容污染,导致对现实世界的认知产生偏差。更严重的是,这种崩溃可能引发基于性别、种族等敏感属性的歧视问题。例如,如果AI逐渐只生成某个种族的描述而忽略其他种族,模型最终会「忘记」这些种族的存在。值得注意的是,模型崩溃与灾难性遗忘(catastrophic forgetting)不同——模型不会完全遗忘已学数据,而是会扭曲错误认知并将其误认为现实,并不断强化这种错误信念。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图4

以一个包含100张猫图片的数据集为例:其中10张是蓝毛猫,90张是黄毛猫。模型可能得出「黄毛猫更普遍」的结论,并在生成新数据时将蓝毛猫「想象」成偏黄的版本。随着训练的持续,蓝毛猫的特征会逐渐被侵蚀,从蓝色演变为绿色甚至黄色。模型崩溃可分为两种类型:早期模型崩溃(模型丢失分布尾部信息)和后期模型崩溃(模型与原始分布模式混淆,最终收敛到与原始分布差异巨大的状态)。造成模型崩溃的两大主因是统计近似误差和函数近似误差。统计近似误差源于重采样过程中信息的丢失,而函数近似误差则与模型表达能力不足或超出原始分布支持范围有关。研究人员Ilia Shumailov指出:「生成数据中的错误会不断累积,最终导致模型对现实产生更严重的误解。模型崩溃的发生速度惊人,模型会迅速遗忘最初学习的真实数据。」

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图5

幸运的是,研究人员提出了两种避免模型崩溃的方法。第一种是保留高质量的人类原创数据集副本,避免与AI生成数据混合,并定期使用这些原始数据重新训练或从头训练模型。第二种方法是持续引入全新的、干净的人类原创数据,确保少数派群体在后续数据中得到公正表征。为了实现这一目标,开发者需要建立大规模的标记机制来区分AI生成内容与人类创作内容。目前已有GPTZero、OpenAI Detector等工具,但它们在特殊文本中效果有限。例如,在EPFL研究中,ChatGPT生成的10个总结中,GPTZero仅检测出6个是AI合成的。研究人员通过微调模型开发了定制的「合成-真实分类器」,在真实MTurk回应中实现了高达99%的准确率。实验表明,AI生成的文本通常与原始内容差异巨大,表明其正在生成新文本而非简单复制粘贴。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图6

「人类数据」的价值在AI时代愈发凸显。随着LLM塑造人类「信息生态系统」,依赖合成数据训练的模型性能会显著下降,甚至出现「痴呆症」现象。虽然众包工作者使用ChatGPT等工具能提高效率,但拯救LLM免于崩溃的关键仍在于真实的人类原创数据。人类数据在科学研究中始终不可或缺,过度依赖合成数据可能导致偏见固化。随着AI模型的普及,人类创作的内容作为原始训练数据的价值将不断提升——尽管人类数据可能包含低概率劣质内容,但生成式AI往往过度拟合流行数据而忽略边缘案例。在生成式AI泛滥的未来,人类创作的内容将成为稀缺资源,其价值将远超以往。参考资料:https://arxiv.org/abs/2306.07899v1https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图7

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图8

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图9

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图10

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图11

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图12

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图13

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图14

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图15

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图16

最新快讯

2026年02月02日

04:15
2026年1月29日,海南离岛免税新政实施已近三个月,自2025年11月1日启动以来成效显著。据海口海关最新数据显示,监管购物金额累计达到100.5亿元,同比增长25.32%,展现出强劲的消费活力。这一新政全面覆盖全岛主要免税店,通过优化购物额度、丰富品类选择及创新提货方式,大幅提升了消费者的购物便利性与体验,有效激发了购买意愿。作为国家推动免税经济“多点开...
00:13
2026年1月29日,全球能源检测组织(GEM)发布权威报告,揭示全球天然气发电装机容量正迎来历史性增长。据预测,今年新增装机规模将创下年度新高,而正在开发中的项目更可能推动现有燃气装机容量增长50%。在这一趋势下,美国已成为全球天然气发电扩张的前沿阵地。据统计,该国目前有252吉瓦的在建燃气项目中,约84吉瓦将直接为AI数据中心提供配套电力支持。 这一大规...
00:12
2026年2月1日,CDPR创意总监Igor Sarzyński透露,《赛博朋克2》或将延续全程第一人称视角设计。他在BlueSky平台表示,开发团队优先追求“不间断沉浸式体验”,《往日之影》中已主动舍弃第三人称过场动画。尽管未明确排除新游戏+或第三人称功能,其表态暗示此类改动可能性较低。他强调:“当一款游戏试图取悦所有人时往往事与愿违”,重申坚持核心叙事...

2026年02月01日

23:12
2026年2月1日,启明星辰在一场备受瞩目的业绩说明会上,正式揭开了公司未来发展的宏伟蓝图——构建三条并行增长曲线的战略布局。这一创新举措不仅彰显了启明星辰在网络安全领域的深厚底蕴,更展现了其面向未来的前瞻视野与雄心壮志。 首条增长曲线聚焦于传统网络安全业务的复苏与振兴。面对日益严峻的网络安全挑战,启明星辰将通过优化产品体系、提升服务效能等举措,推动传统业务...
23:12
2026年2月1日,华懋科技正式发布公告,宣布因标的公司富创优越的财务报表需按照监管要求进行加期审计,相关并购审核程序将暂时中止。这一举措属于交易过程中的常规环节,并不构成任何实质性障碍。华懋科技强调,公司正积极与中介机构紧密合作,全力推进审计工作及后续申报流程,确保整体收购进展保持正常,未出现任何重大变化。此次加期审计旨在确保财务数据的准确性和合规性,符合...
23:12
2月1日,华为云在医疗人工智能协同创新论坛上隆重发布业界首个智慧病理云边端解决方案,标志着医疗AI技术迈向了新的里程碑。该方案专为基层医院及医生量身打造,通过依托华为云“行业AI梦工厂”智慧医疗专区,与瑞金医院强强联手,成功推出RuiPath智慧病理一体机,为基层病理诊断领域带来革命性突破。同时,华为云携手爱康集团,创新构建个人健康管理智能体,进一步推动医疗...
23:12
2026年1月31日,由中国东方电气集团承建的埃塞俄比亚阿伊萨风电项目在索马里州正式投产发电,标志着非洲大陆清洁能源发展迈入新阶段。该项目自2017年启动以来,历经数年精心建设,最终实现了阶段性胜利。项目总装机容量达120兆瓦,采用48台东方电气自主研发的2.5兆瓦风电机组,单机效率高、稳定性强,能够有效适应埃塞俄比亚复杂多变的气候条件。 目前,项目第一阶段...
22:42
2026年1月31日,消息人士Dusk Golem在X平台证实,《生化危机:安魂曲》中将不会出现克里斯·雷德菲尔德与艾达·王两位经典角色。该消息系对玩家提问的明确回应,其称“就我听说到的情况来看,两个人都不会出现”。《生化危机:安魂曲》为Capcom新公布的系列衍生作品,目前尚未公布发售日期及具体玩法。克里斯与艾达分别作为系列核心主角与标志性反派,曾活跃于...
22:11
2026年2月1日,PGYTech在Kickstarter平台推出RetroVa摄影套件,适配iPhone 16 Pro、17 Pro,未来支持iPhone 18系列。该套件含手机壳、摄影手柄与长焦增距镜,手柄配备两段式快门键、变焦拨杆、自定义波轮及microSD卡槽(读写达312MB/s),可录制ProRes视频。增距镜为16 Pro提供等效282mm(...
22:11
2026年2月1日,隆华科技(300263)披露,公司已与多家国内主要商业航天企业建立配套合作关系。公司聚焦结构新材料业务,以PMI泡沫为核心,提供轻质高强、透波性优、隔振耐高温的轻量化减重材料。该材料已通过航空航天领域多项检测认证,适配火箭整流罩、卫星平台等关键部件。合作源于商业航天对载荷减重的刚性需求,多家企业已就定制化轻量化方案主动接洽。公司坚持‘第...
21:41
2026年2月1日,联想员工微博博主@果壳中的空间预热新款小新Pro GT酷睿版笔记本。该系列含14英寸与16英寸两款,分别定位“续航之王”与“性能之王”,搭载Ultra 5/338H、Ultra X7/358H及X9/388H处理器,标配32GB内存、1TB PCIe 5.0 SSD(M.2 2242),并预留PCIe 4.0 M.2 2280插槽。14...
21:41
2026年1月底,美国加州大学圣克鲁斯分校研究人员披露新型攻击方法CHAI,可在不入侵系统前提下,通过优化文字标牌干扰自动驾驶汽车与无人机决策。该攻击利用视觉-语言大模型对图像语义的依赖,在摄像头视野内展示特定颜色、字体及内容的标牌,诱使AI误判环境。实验显示,无人机在人群屋顶误降率达68.1%,自动驾驶系统左转冲向行人成功率81.8%,目标识别系统欺骗成...