人类创作的文本始终比AI生成的文本更具价值。随着GPT-4、Stable Diffusion和Midjourney等生成式AI技术的迅速崛起,越来越多的人开始将其融入工作和生活。甚至有研究者尝试利用AI生成的数据来训练新的AI模型,试图打造所谓的「数据永动机」。然而,牛津大学、剑桥大学和帝国理工学院等顶尖机构的研究人员发现,如果在训练过程中过度依赖AI内容,会导致模型出现灾难性的「模型崩溃」,造成不可逆转的缺陷。这意味着,随着时间的推移,AI模型会逐渐遗忘真实的基础数据。即使在理想的长期学习环境下,这一问题也无法避免。因此,研究人员强烈呼吁,为了维持大规模数据训练带来的模型优势,必须重视人类原创文本的价值。相关研究论文可查阅:https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图

然而,现实情况更为复杂——你以为的「人类数据」,可能并非完全由人类创作。洛桑联邦理工学院(EPFL)的最新研究表明,高达33%-46%的人类数据实际上是由AI生成的。这意味着,当前训练AI模型所依赖的数据中,相当一部分是「垃圾数据」。尽管GPT-4等大语言模型已展现出惊人的文本生成能力,能够模仿人类写作风格,但它们的训练数据主要源自过去几十年互联网上的公开交流。如果未来模型继续依赖网络爬取,不可避免地会纳入自身生成的文本,从而加剧模型崩溃的风险。研究人员预测,随着GPT系列的迭代发展,这一问题将日益严重。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图1

在这种背景下,为AI模型准备高质量的人类原创数据变得至关重要。亚马逊的Mechanical Turk(MTurk)自2005年上线以来,已成为许多人的兼职选择。科研人员通过MTurk发布各种需要人类智能的任务,如图像标注、问卷调查等,这些任务往往难以通过计算机算法完成。MTurk也因此成为预算有限的科研人员和企业的「优选方案」,就连贝佐斯曾戏称其为「人工人工智能」。除了MTurk,Prolific等众包平台也已成为研究者和行业实践者的核心数据来源,提供创建、标注和总结各类数据的方法。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图2

但EPFL的研究揭示了一个令人担忧的事实:在这些关键的人类数据来源中,近半数内容是由标注员使用AI工具生成的。相关论文链接:https://arxiv.org/abs/2306.07899v1

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图3

「模型崩溃」是指当AI模型被大量AI生成数据「喂养」后,会出现的跨代退化现象。具体来说,新一代模型的训练数据会被前代模型的生成内容污染,导致对现实世界的认知产生偏差。更严重的是,这种崩溃可能引发基于性别、种族等敏感属性的歧视问题。例如,如果AI逐渐只生成某个种族的描述而忽略其他种族,模型最终会「忘记」这些种族的存在。值得注意的是,模型崩溃与灾难性遗忘(catastrophic forgetting)不同——模型不会完全遗忘已学数据,而是会扭曲错误认知并将其误认为现实,并不断强化这种错误信念。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图4

以一个包含100张猫图片的数据集为例:其中10张是蓝毛猫,90张是黄毛猫。模型可能得出「黄毛猫更普遍」的结论,并在生成新数据时将蓝毛猫「想象」成偏黄的版本。随着训练的持续,蓝毛猫的特征会逐渐被侵蚀,从蓝色演变为绿色甚至黄色。模型崩溃可分为两种类型:早期模型崩溃(模型丢失分布尾部信息)和后期模型崩溃(模型与原始分布模式混淆,最终收敛到与原始分布差异巨大的状态)。造成模型崩溃的两大主因是统计近似误差和函数近似误差。统计近似误差源于重采样过程中信息的丢失,而函数近似误差则与模型表达能力不足或超出原始分布支持范围有关。研究人员Ilia Shumailov指出:「生成数据中的错误会不断累积,最终导致模型对现实产生更严重的误解。模型崩溃的发生速度惊人,模型会迅速遗忘最初学习的真实数据。」

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图5

幸运的是,研究人员提出了两种避免模型崩溃的方法。第一种是保留高质量的人类原创数据集副本,避免与AI生成数据混合,并定期使用这些原始数据重新训练或从头训练模型。第二种方法是持续引入全新的、干净的人类原创数据,确保少数派群体在后续数据中得到公正表征。为了实现这一目标,开发者需要建立大规模的标记机制来区分AI生成内容与人类创作内容。目前已有GPTZero、OpenAI Detector等工具,但它们在特殊文本中效果有限。例如,在EPFL研究中,ChatGPT生成的10个总结中,GPTZero仅检测出6个是AI合成的。研究人员通过微调模型开发了定制的「合成-真实分类器」,在真实MTurk回应中实现了高达99%的准确率。实验表明,AI生成的文本通常与原始内容差异巨大,表明其正在生成新文本而非简单复制粘贴。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图6

「人类数据」的价值在AI时代愈发凸显。随着LLM塑造人类「信息生态系统」,依赖合成数据训练的模型性能会显著下降,甚至出现「痴呆症」现象。虽然众包工作者使用ChatGPT等工具能提高效率,但拯救LLM免于崩溃的关键仍在于真实的人类原创数据。人类数据在科学研究中始终不可或缺,过度依赖合成数据可能导致偏见固化。随着AI模型的普及,人类创作的内容作为原始训练数据的价值将不断提升——尽管人类数据可能包含低概率劣质内容,但生成式AI往往过度拟合流行数据而忽略边缘案例。在生成式AI泛滥的未来,人类创作的内容将成为稀缺资源,其价值将远超以往。参考资料:https://arxiv.org/abs/2306.07899v1https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图7

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图8

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图9

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图10

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图11

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图12

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图13

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图14

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图15

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图16

最新快讯

2026年03月19日

04:46
微新创想:3月19日,美国半导体企业美光科技表示,当前AI服务器市场需求持续强劲。然而,人工智能及通用服务器的整体出货节奏受限于存储芯片(尤其是高带宽内存HBM及DDR5)的供应能力。 公司指出,产能爬坡与先进封装资源紧张是主要瓶颈。这表明,尽管AI技术发展迅速,但存储芯片的供应状况仍然是制约整个行业扩张的重要因素。 随着AI应用的不断扩展,对高性能计算设备...
02:27
微新创想:2026年3月19日,苹果公司正式向iPhone和iPad用户推送iOS/iPadOS 18.7.7 RC系统更新(版本号22H333) 此次更新距离上一版RC发布已间隔141天,属于常规的稳定性与安全维护升级 用户可通过【设置】→【通用】→【软件更新】的路径获取该更新,无需使用开发者账号即可完成下载和安装 苹果公司尚未公布此次更新的具...
02:27
微新创想:2026年3月19日,苹果公司正式向iPhone和iPad用户推送iOS/iPadOS 26.4 RC系统更新,版本号为23E244。此次更新距离上一版Beta/RC版本发布仅间隔9天,属于正式发布前的重要候选版本。该版本主要面向已注册Apple Beta版软件计划的公众测试用户以及开发者计划成员开放。用户可以通过设备上的设置选项进行在线升级,路径...
02:27
微新创想:2026年3月19日,迪士尼CEO宣布将在旗下流媒体平台(如Disney+)新增沉浸式体验内容与原创游戏。此举旨在提升用户参与度与订阅黏性,应对流媒体市场竞争加剧。 新内容将分阶段上线,初期聚焦IP联动的轻量级互动体验。通过结合迪士尼经典IP与现代互动技术,用户可以更深入地参与到故事中,获得独特的娱乐体验。 后续拓展跨平台游戏服务,进一步丰富用户在...
02:27
微新创想:3月17日,美国联邦航空管理局(FAA)批准波音公司推进777-9型客机进入适航认证第四阶段测试。该机型自研发以来多次延期,目前处于关键取证阶段。 FAA此次授权意味着波音可开展更复杂的飞行与系统验证任务,包括极端天气、发动机失效等高风险科目。此举旨在加速解决此前因设计审查和安全整改导致的进度滞后问题。 777-9是波音777X系列首款量产机型,计...
02:27
微新创想:福特公司首席运营官在2026年3月19日的公开表态中确认 诺贝丽斯铝厂预计将在当年5月至9月间恢复全面生产 此次恢复生产对于福特而言具有重要意义 该铝厂是其关键的轻量化材料供应商 在此前的停产期间 曾对多款新能源车型的供应链造成影响 福特表示正在与诺贝丽斯紧密合作 推进设备检修和产能爬坡 工作进展将直接影响复产时间 具体复产日期将根据相关认证进度而...
02:27
微新创想:2026年3月19日,丰田汽车公司在美国宣布召回约14.42万辆汽车。此次召回涉及部分2023至2025款凯美瑞、卡罗拉及雷凌车型。根据官方公告,召回的原因是前排座椅滑轨存在焊接缺陷,这可能导致座椅在发生碰撞时发生移位,从而带来潜在的安全风险。 丰田汽车公司表示,所有受影响的车辆将被免费检查,并根据情况重新焊接或更换滑轨组件。这一措施旨在确保车辆的...
00:47
微新创想:3月19日,Meta公司在全球范围内于Facebook平台正式推出创作者快速通道计划。该计划面向符合条件的内容创作者,旨在简化入驻流程、加速审核认证,并提供早期工具访问及运营支持。此举意在增强平台内容生态活力,提升创作者留存与变现效率。 参与创作者需满足原创性、活跃度及社区准则等基本要求,审核周期将缩短至72小时内。这一举措不仅提高了创作者的入驻体...
00:04
微新创想:2026年3月,飞利浦发布Moving Sound系列音频产品,庆祝其音频业务成立100周年。这一系列的推出不仅标志着飞利浦在音频领域的百年历程,也展现了其对经典设计与现代科技融合的全新探索。 该系列包含Tube与Roller两款无线音箱、Ringo Duo头戴式耳机以及Buds真无线耳机。每款产品都承载着独特的设计理念,旨在为用户带来兼具怀旧感与...

2026年03月18日

23:29
微新创想:3月18日,腾讯高管回应存储芯片涨价问题称,AI需求激增导致DRAM、HBM及各类存储设备订单需提前数月乃至数年预订。供应商优先保障大客户,中小云厂商供应链稳定性显著下降。在此背景下,行业面临成本压力,只能将上涨成本转嫁至终端售价。过去24小时内,多家中国云厂商已实施多类服务价格上调。
23:29
微新创想:2026年3月18日,水利部等七部门联合印发《关于加快推动小水电绿色转型高质量发展的指导意见》。该意见提出,到2035年基本实现小水电智能化、集约化、标准化发展。文件聚焦严控新增开发、推进存量改造、强化生态修复、提升安全生产、服务乡村振兴及完善保障机制六大任务。此举旨在推动小水电与经济社会全面绿色转型相适应,助力碳达峰碳中和目标实现。
23:29
微新创想:2026年3月18日,宝马宣布完成对Alpina的整合,首批“宝马Alpina”车型将基于全新7系和X7打造。新车预计在年内发布,提供燃油及纯电两种动力形式,满足不同消费者的需求。 Alpina的定位与宝马M部门有所不同,它更强调速度、奢华与舒适,而非极致的性能追求。这种差异化策略使得Alpina能够吸引那些既注重驾驶体验又重视舒适性的高端用户群体...