人类创作的文本始终比AI生成的文本更具价值。随着GPT-4、Stable Diffusion和Midjourney等生成式AI技术的迅速崛起,越来越多的人开始将其融入工作和生活。甚至有研究者尝试利用AI生成的数据来训练新的AI模型,试图打造所谓的「数据永动机」。然而,牛津大学、剑桥大学和帝国理工学院等顶尖机构的研究人员发现,如果在训练过程中过度依赖AI内容,会导致模型出现灾难性的「模型崩溃」,造成不可逆转的缺陷。这意味着,随着时间的推移,AI模型会逐渐遗忘真实的基础数据。即使在理想的长期学习环境下,这一问题也无法避免。因此,研究人员强烈呼吁,为了维持大规模数据训练带来的模型优势,必须重视人类原创文本的价值。相关研究论文可查阅:https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图

然而,现实情况更为复杂——你以为的「人类数据」,可能并非完全由人类创作。洛桑联邦理工学院(EPFL)的最新研究表明,高达33%-46%的人类数据实际上是由AI生成的。这意味着,当前训练AI模型所依赖的数据中,相当一部分是「垃圾数据」。尽管GPT-4等大语言模型已展现出惊人的文本生成能力,能够模仿人类写作风格,但它们的训练数据主要源自过去几十年互联网上的公开交流。如果未来模型继续依赖网络爬取,不可避免地会纳入自身生成的文本,从而加剧模型崩溃的风险。研究人员预测,随着GPT系列的迭代发展,这一问题将日益严重。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图1

在这种背景下,为AI模型准备高质量的人类原创数据变得至关重要。亚马逊的Mechanical Turk(MTurk)自2005年上线以来,已成为许多人的兼职选择。科研人员通过MTurk发布各种需要人类智能的任务,如图像标注、问卷调查等,这些任务往往难以通过计算机算法完成。MTurk也因此成为预算有限的科研人员和企业的「优选方案」,就连贝佐斯曾戏称其为「人工人工智能」。除了MTurk,Prolific等众包平台也已成为研究者和行业实践者的核心数据来源,提供创建、标注和总结各类数据的方法。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图2

但EPFL的研究揭示了一个令人担忧的事实:在这些关键的人类数据来源中,近半数内容是由标注员使用AI工具生成的。相关论文链接:https://arxiv.org/abs/2306.07899v1

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图3

「模型崩溃」是指当AI模型被大量AI生成数据「喂养」后,会出现的跨代退化现象。具体来说,新一代模型的训练数据会被前代模型的生成内容污染,导致对现实世界的认知产生偏差。更严重的是,这种崩溃可能引发基于性别、种族等敏感属性的歧视问题。例如,如果AI逐渐只生成某个种族的描述而忽略其他种族,模型最终会「忘记」这些种族的存在。值得注意的是,模型崩溃与灾难性遗忘(catastrophic forgetting)不同——模型不会完全遗忘已学数据,而是会扭曲错误认知并将其误认为现实,并不断强化这种错误信念。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图4

以一个包含100张猫图片的数据集为例:其中10张是蓝毛猫,90张是黄毛猫。模型可能得出「黄毛猫更普遍」的结论,并在生成新数据时将蓝毛猫「想象」成偏黄的版本。随着训练的持续,蓝毛猫的特征会逐渐被侵蚀,从蓝色演变为绿色甚至黄色。模型崩溃可分为两种类型:早期模型崩溃(模型丢失分布尾部信息)和后期模型崩溃(模型与原始分布模式混淆,最终收敛到与原始分布差异巨大的状态)。造成模型崩溃的两大主因是统计近似误差和函数近似误差。统计近似误差源于重采样过程中信息的丢失,而函数近似误差则与模型表达能力不足或超出原始分布支持范围有关。研究人员Ilia Shumailov指出:「生成数据中的错误会不断累积,最终导致模型对现实产生更严重的误解。模型崩溃的发生速度惊人,模型会迅速遗忘最初学习的真实数据。」

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图5

幸运的是,研究人员提出了两种避免模型崩溃的方法。第一种是保留高质量的人类原创数据集副本,避免与AI生成数据混合,并定期使用这些原始数据重新训练或从头训练模型。第二种方法是持续引入全新的、干净的人类原创数据,确保少数派群体在后续数据中得到公正表征。为了实现这一目标,开发者需要建立大规模的标记机制来区分AI生成内容与人类创作内容。目前已有GPTZero、OpenAI Detector等工具,但它们在特殊文本中效果有限。例如,在EPFL研究中,ChatGPT生成的10个总结中,GPTZero仅检测出6个是AI合成的。研究人员通过微调模型开发了定制的「合成-真实分类器」,在真实MTurk回应中实现了高达99%的准确率。实验表明,AI生成的文本通常与原始内容差异巨大,表明其正在生成新文本而非简单复制粘贴。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图6

「人类数据」的价值在AI时代愈发凸显。随着LLM塑造人类「信息生态系统」,依赖合成数据训练的模型性能会显著下降,甚至出现「痴呆症」现象。虽然众包工作者使用ChatGPT等工具能提高效率,但拯救LLM免于崩溃的关键仍在于真实的人类原创数据。人类数据在科学研究中始终不可或缺,过度依赖合成数据可能导致偏见固化。随着AI模型的普及,人类创作的内容作为原始训练数据的价值将不断提升——尽管人类数据可能包含低概率劣质内容,但生成式AI往往过度拟合流行数据而忽略边缘案例。在生成式AI泛滥的未来,人类创作的内容将成为稀缺资源,其价值将远超以往。参考资料:https://arxiv.org/abs/2306.07899v1https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图7

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图8

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图9

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图10

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图11

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图12

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图13

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图14

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图15

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图16

最新快讯

2025年08月04日

10:48
印度社交游戏平台STAN成功斩获850万美元股权融资,谷歌旗下AI未来基金鼎力参与,彰显了全球资本对印度游戏社交市场的热切关注。此次融资吸引了万代南梦宫娱乐、史克威尔艾尼克斯、Reazon Holdings等国际知名投资方,进一步印证了该领域的巨大潜力。STAN虽以新加坡为总部,却致力于打造一款能与Discord抗衡的游戏社区平台,其独特市场策略令人瞩目。 ...
10:48
8月4日,中国机械工业联合会最新发布的数据显示,截至今年6月末,我国机械工业应收账款总额已攀升至9.3万亿元,同比增长9.4%,这一数字占全国工业应收账款总额的35%,成为工业领域的重要构成部分。值得注意的是,机械工业应收账款的平均回收期达到105.3天,显著高于全国工业平均水平的70.8天,整整长35.5天,反映出行业在资金周转效率方面仍存在提升空间。 从...
10:48
2025年8月4日,备受市场关注的农业科技企业小菜园(股票代码00999)正式发布上半年业绩预告,公告显示公司预计实现净利润3.6亿元至3.8亿元,较去年同期大幅增长约28.57%至35.71%。这一亮眼表现不仅彰显了公司稳健的盈利能力,更折射出其精细化运营战略的成功实践。公司管理层在公告中明确指出,净利润的显著提升主要源于三大核心驱动因素:运营效率的持续优...
10:48
2025年8月4日,星图金融研究院副院长薛洪言在行业研讨会上发表重要观点,指出银行理财净值化转型正深刻重塑市场格局与投资者行为模式。这一变革的核心在于打破了传统理财产品的"刚兑"预期,促使投资者风险意识显著提升,对含权类理财产品的接受度也随之提高。在净值化时代背景下,投资者需要重新认识"收益非线性增长"的市场特征,并积极调整投资策略。 薛洪言强调,面对净值化...
10:48
2025年8月4日,A股市场迎来一则重要消息,知名券商ETF(代码:512000)正式宣布实施份额拆分,比例高达1拆2。这一举措旨在优化基金流动性,降低投资门槛,从而吸引更多元化的投资者参与。与此同时,技术分析显示MACD指标形成金叉,释放出积极的看涨信号,市场情绪随之出现明显回暖。受此利好影响,部分前期表现强势的个股也纷纷放量上涨,展现出较强的市场动能。 ...
10:48
2025年7月,新疆灰枣主产区遭遇罕见气候挑战,沙尘暴与极端高温天气交织,导致枣树开花坐果率严重受损。一茬花坐果效果远低于正常水平,而二三茬花坐果率也未能达到预期标准。综合各方面数据,今年新疆灰枣总产量预估仅为42万吨,较正常年份的65万吨大幅减产35%,减产幅度惊人。 为准确评估减产情况,调研团队深入走访了233个枣园样本,通过挂果抽样与专家现场评估相...
10:48
华为常务董事、终端BG董事长余承东近日惊喜宣布,备受瞩目的尊界S800自正式上市以来,仅用短短67天时间,大定数量便强势突破10000台这一里程碑。这一亮眼成绩充分彰显了消费者对华为智能汽车解决方案的高度认可与市场信心。作为华为在智能汽车领域的重要布局,尊界S800凭借其卓越性能表现、创新智能体验以及前瞻设计理念,迅速在市场上脱颖而出,成为华为智能汽车业务版...
10:48
我国近日成功牵头制定并发布全球首项鞋类有机溶剂测定国际标准,这一里程碑事件标志着我国在鞋类安全检测领域取得重大突破。该标准创新性地采用先进的气相色谱-质谱联用技术,能够同时精准检测15种常见的有毒有机溶剂,相较于传统检测方法,检测种类数量大幅提升3倍,检测效率更是显著提高3至5倍。这一技术革新不仅有效解决了传统检测方法中存在的检测种类有限、操作流程复杂等核心...
10:48
8月4日,中信证券正式发布了一份关于2025年下半年半导体产业的投资策略报告,其中明确指出当前半导体行业正处在周期性上升的关键阶段。报告强调,人工智能产业的持续高速发展已成为推动半导体行业前进的核心引擎。随着AI技术的不断突破和应用场景的持续拓展,半导体产业的增长动力愈发强劲。 报告详细分析了AI产业在半导体领域的应用现状,指出云端AI需求呈现稳定增长态势,...
10:46
近日,山西太原一对年轻情侣在结束山东之旅返程途中遭遇了一场令人心悸的严重车祸,然而命运却奇迹般地让他们仅受皮外伤。事故过后,这对情侣做出了一个令人意想不到的决定——火速前往民政局办理结婚登记,将这段缘分在生死考验中升华。 据现场处理事故的交警回忆,这起车祸的惨烈程度远超想象。事故车辆的车头车尾严重变形,几乎被金属挤压成铁饼状,后排车顶完全坍塌,金属部件扭曲变...
10:46
8月3日,江苏南通海门区三星镇一家长新开业的丸子汤店因招牌使用不雅词汇而迅速登上网络热搜。据当地网友拍摄的视频显示,该店招牌上赫然印着粗俗不堪的脏话内容,字迹清晰可见,令人瞠目结舌。不少网友在社交媒体上直呼"辣眼睛",称其有损市容市貌,更对当地营商环境造成负面影响。 事件发酵后,三星镇政府的反应速度令人称赞。相关工作人员第一时间向记者证实,当晚便组织执法人员...