人类创作的文本始终比AI生成的文本更具价值。随着GPT-4、Stable Diffusion和Midjourney等生成式AI技术的迅速崛起,越来越多的人开始将其融入工作和生活。甚至有研究者尝试利用AI生成的数据来训练新的AI模型,试图打造所谓的「数据永动机」。然而,牛津大学、剑桥大学和帝国理工学院等顶尖机构的研究人员发现,如果在训练过程中过度依赖AI内容,会导致模型出现灾难性的「模型崩溃」,造成不可逆转的缺陷。这意味着,随着时间的推移,AI模型会逐渐遗忘真实的基础数据。即使在理想的长期学习环境下,这一问题也无法避免。因此,研究人员强烈呼吁,为了维持大规模数据训练带来的模型优势,必须重视人类原创文本的价值。相关研究论文可查阅:https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图

然而,现实情况更为复杂——你以为的「人类数据」,可能并非完全由人类创作。洛桑联邦理工学院(EPFL)的最新研究表明,高达33%-46%的人类数据实际上是由AI生成的。这意味着,当前训练AI模型所依赖的数据中,相当一部分是「垃圾数据」。尽管GPT-4等大语言模型已展现出惊人的文本生成能力,能够模仿人类写作风格,但它们的训练数据主要源自过去几十年互联网上的公开交流。如果未来模型继续依赖网络爬取,不可避免地会纳入自身生成的文本,从而加剧模型崩溃的风险。研究人员预测,随着GPT系列的迭代发展,这一问题将日益严重。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图1

在这种背景下,为AI模型准备高质量的人类原创数据变得至关重要。亚马逊的Mechanical Turk(MTurk)自2005年上线以来,已成为许多人的兼职选择。科研人员通过MTurk发布各种需要人类智能的任务,如图像标注、问卷调查等,这些任务往往难以通过计算机算法完成。MTurk也因此成为预算有限的科研人员和企业的「优选方案」,就连贝佐斯曾戏称其为「人工人工智能」。除了MTurk,Prolific等众包平台也已成为研究者和行业实践者的核心数据来源,提供创建、标注和总结各类数据的方法。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图2

但EPFL的研究揭示了一个令人担忧的事实:在这些关键的人类数据来源中,近半数内容是由标注员使用AI工具生成的。相关论文链接:https://arxiv.org/abs/2306.07899v1

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图3

「模型崩溃」是指当AI模型被大量AI生成数据「喂养」后,会出现的跨代退化现象。具体来说,新一代模型的训练数据会被前代模型的生成内容污染,导致对现实世界的认知产生偏差。更严重的是,这种崩溃可能引发基于性别、种族等敏感属性的歧视问题。例如,如果AI逐渐只生成某个种族的描述而忽略其他种族,模型最终会「忘记」这些种族的存在。值得注意的是,模型崩溃与灾难性遗忘(catastrophic forgetting)不同——模型不会完全遗忘已学数据,而是会扭曲错误认知并将其误认为现实,并不断强化这种错误信念。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图4

以一个包含100张猫图片的数据集为例:其中10张是蓝毛猫,90张是黄毛猫。模型可能得出「黄毛猫更普遍」的结论,并在生成新数据时将蓝毛猫「想象」成偏黄的版本。随着训练的持续,蓝毛猫的特征会逐渐被侵蚀,从蓝色演变为绿色甚至黄色。模型崩溃可分为两种类型:早期模型崩溃(模型丢失分布尾部信息)和后期模型崩溃(模型与原始分布模式混淆,最终收敛到与原始分布差异巨大的状态)。造成模型崩溃的两大主因是统计近似误差和函数近似误差。统计近似误差源于重采样过程中信息的丢失,而函数近似误差则与模型表达能力不足或超出原始分布支持范围有关。研究人员Ilia Shumailov指出:「生成数据中的错误会不断累积,最终导致模型对现实产生更严重的误解。模型崩溃的发生速度惊人,模型会迅速遗忘最初学习的真实数据。」

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图5

幸运的是,研究人员提出了两种避免模型崩溃的方法。第一种是保留高质量的人类原创数据集副本,避免与AI生成数据混合,并定期使用这些原始数据重新训练或从头训练模型。第二种方法是持续引入全新的、干净的人类原创数据,确保少数派群体在后续数据中得到公正表征。为了实现这一目标,开发者需要建立大规模的标记机制来区分AI生成内容与人类创作内容。目前已有GPTZero、OpenAI Detector等工具,但它们在特殊文本中效果有限。例如,在EPFL研究中,ChatGPT生成的10个总结中,GPTZero仅检测出6个是AI合成的。研究人员通过微调模型开发了定制的「合成-真实分类器」,在真实MTurk回应中实现了高达99%的准确率。实验表明,AI生成的文本通常与原始内容差异巨大,表明其正在生成新文本而非简单复制粘贴。

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图6

「人类数据」的价值在AI时代愈发凸显。随着LLM塑造人类「信息生态系统」,依赖合成数据训练的模型性能会显著下降,甚至出现「痴呆症」现象。虽然众包工作者使用ChatGPT等工具能提高效率,但拯救LLM免于崩溃的关键仍在于真实的人类原创数据。人类数据在科学研究中始终不可或缺,过度依赖合成数据可能导致偏见固化。随着AI模型的普及,人类创作的内容作为原始训练数据的价值将不断提升——尽管人类数据可能包含低概率劣质内容,但生成式AI往往过度拟合流行数据而忽略边缘案例。在生成式AI泛滥的未来,人类创作的内容将成为稀缺资源,其价值将远超以往。参考资料:https://arxiv.org/abs/2306.07899v1https://arxiv.org/abs/2305.17493v2

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图7

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图8

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图9

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图10

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图11

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图12

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图13

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图14

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图15

GPT-5陷模型崩溃危机 AI训AI或致严重缺陷插图16

最新快讯

2026年05月04日

16:33
微新创想:《夺宝奇兵:古老之圈》即将登陆任天堂Switch 2平台 5月12日,《夺宝奇兵:古老之圈》将正式登陆任天堂Switch 2平台。这款备受期待的动作冒险游戏终于迎来了新的版本,为玩家带来更加丰富的游戏体验。 MachineGames创意总监Axel Torvenius确认了游戏在Switch 2上的表现细节。游戏主机模式的分辨率为1080p,而掌机...
16:33
微新创想:2026年5月4日,育碧《刺客信条黑旗:记忆重置》开发总监Richard Knight在AMA活动中透露,本作将新增舰船自动驾驶功能,全面重做所有支线内容并回归通缉系统。这一系列更新不仅丰富了游戏玩法,也提升了整体的沉浸感。 游戏仍采用16×16公里地图,但新增岛屿与地点以增强世界密度。这些新增内容将为玩家带来更加广阔的探索空间,同时保持原有的地图...
16:33
微新创想:2026年5月4日 追觅科技CEO俞浩在微博公开表示“追觅为什么可以超越苹果?因为苹果不创新了”并宣称要“继承乔布斯遗志,打败苹果”。他同步发起互动 向公众征集iPhone使用痛点及手机行业创新创意。此举发生于追觅手机团队1月亮相西南欧经销商大会 展示高奢与模块化旗舰机型之后。俞浩此前多次表态 称追觅手机将与苹果、三星全球三分天下 并冲击世界第一。...
16:33
微新创想:2026年5月2日,伯克希尔·哈撒韦CEO格雷格·阿贝尔在奥马哈股东大会上表示,公司不会为追热点而投资AI。这一表态引发了广泛讨论,显示出伯克希尔在AI领域的独特立场。 阿贝尔代表伯克希尔·哈撒韦公司,明确表达了对人工智能投资的态度。他强调,伯克希尔不会盲目追逐AI热潮,而是坚持只在能够创造增量价值的领域应用AI技术。 阿贝尔指出,AI的应用必须具...
16:33
微新创想:2026年5月4日,英特尔正式推出锐炫Arc显卡Windows图形驱动32.0.101.8737版本。此次更新主要面向酷睿Ultra 100/200/300系列处理器以及所有Arc独立显卡型号,包括A系列和B系列。该驱动版本旨在提供更稳定的系统运行环境,确保用户在使用过程中能够获得更好的兼容性与性能表现。 微新创想:尽管本次驱动更新未包含针对新游戏...
16:33
微新创想:2026年5月4日,YouTube网页版被曝存在前端逻辑缺陷,导致Firefox、Brave及Edge等浏览器播放视频时频繁卡顿、标签页无响应。这一问题主要出现在用户与视频互动时,例如点击点赞、点踩或分享按钮,这些操作引发了前端代码的无限显示与隐藏循环。 微新创想:由于该循环问题,浏览器在处理视频播放时每秒会进行数千次重排计算,这不仅严重影响了用户...
16:33
微新创想:5月4日,Claymore Game Studios宣布《盟军敢死队:起源》大型DLC“不弃袍泽”正式登陆Xbox Series X|S、PS5及PC(Steam/Windows)平台。此次更新为玩家带来了全新的任务内容,聚焦营救被困战友与摧毁纳粹超级武器原型,延续了经典潜入玩法的精髓。 DLC任务设定于二战时期的法国战场,玩家将扮演指挥官,带领多...
16:01
微新创想:2026年6月14日至18日,铠侠与闪迪将在美国夏威夷举行的VLSI Symposium研讨会上联合展出多层堆叠单元架构QLC NAND闪存。此次展示标志着他们在3D NAND技术领域的重大进展,目标是突破1000层的极限。 微新创想:双方已提前公布MSA-CBA器件架构及FIB-SEM堆叠图像,为行业提供了宝贵的参考。这些图像和数据不仅展示了技术...
16:01
微新创想:2026年5月,三星在CES展上正式亮相了Bespoke AI Family Hub冰箱,这款产品搭载了三星自主研发的Vision AI技术。该冰箱不仅能够识别用户的声音,还能实时记录内部食材的状态,为用户提供个性化的菜谱推荐,并自动将缺货的食材同步至Instacart购物清单,极大提升了用户的购物效率和生活便利性。 部分高级AI功能将在2026年...
16:00
微新创想:2026年5月2日 爆料人yeux1122在NAVER博客披露三星Galaxy Z Flip8关键信息 爆料人yeux1122在NAVER博客上分享了关于三星Galaxy Z Flip8的最新消息 这款设备在尺寸和结构设计上进行了小幅调整 据爆料内容显示 三星Galaxy Z Flip8的宽度将达到75.4毫米 相比前代Flip7增加了0.2毫米 ...
16:00
微新创想:特斯拉近日在迈阿密海滩卢默斯公园F1粉丝嘉年华上设立了自动驾驶快闪体验区。此次活动从4月29日持续到5月3日,成为特斯拉展示其未来出行愿景的重要窗口。作为核心展品,特斯拉展示了Cybertruck牵引Cybercab的创新场景,吸引了大量观众驻足体验。 此次快闪活动被视为特斯拉2026年上半年进军迈阿密等七座城市的自动驾驶出租车服务的重要预热。特斯...
15:30
微新创想:2026年5月4日,新能源汽车电池安全管理技术企业哲弗智能正式向香港交易所递交上市招股书。公司总部位于中国,专注于电池智能热管理、智能灭火及电机热管理等系统研发与集成服务,为新能源汽车提供安全技术解决方案。 此次IPO旨在拓展研发能力、升级产线并加强全球市场技术支持。哲弗智能已实现核心技术量产应用,客户覆盖多家主流车企。公司凭借在电池安全领域的深厚...