滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图

编者按:本文来自微信公众号量子位(ID:QbitAI),作者:金磊 尚恩,微新创想经授权转载,头图来自摄图网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图1

污染中文互联网,AI成了“罪魁祸首”之一。事情是这样的。最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:象鼻山是否有缆车?Bing也是有问必答,给出了看似挺靠谱的答案:在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。甚至能在1分钟之内回答2个问题。在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……并且他认为,这就是导致Bing输出错误答案的原因:这个AI疯狂地污染中文互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图2

“AI污染源”,不止这一个那么被网友发现的这位AI用户,现在怎么样了?从目前结果来看,他已经被被知乎“判处”为禁言状态。但尽管如此,也有其他网友直言不讳地表示:不止一个。若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图3

事实上,诸如此类的“AI污染源”不止是在这一个平台上有。就连简单的科普配图这事上,AI也是屡屡犯错。网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。甚至各类AI生成的假新闻也是屡见不鲜。例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。警方均已对他们采取了刑事强制措施。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图4

但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。程序员问答社区Stack Overflow便是一个例子。早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。当时官方给出来的理由是这样的:(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。因为从ChatGPT得到错误答案的概率太高了!Stack Overflow进一步阐述了这种现象。他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。一言蔽之,AI污染了社区环境。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图5

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。不过,还是老问题,答案的准确性如何,就不得而知了。但这种现象背后,其实还隐藏着更大的隐患。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图6

滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图7

AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……而如此滥用AI,反过来也是一种自噬。最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图8

对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮·伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图9

基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图10

话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图11

参考链接:[1]https://www.v2ex.com/t/948487[2]https://twitter.com/oran_ge/status/1669160826186633219[3]https://www.qbitai.com/2022/12/40167.html[4]https://arxiv.org/abs/2305.17493v2[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250[6]https://futurism.com/ai-generates-fake-news

AI泛滥污染中文互联网:滥用AI毁了AI自身插图12

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图13

AI泛滥污染中文互联网:滥用AI毁了AI自身插图14

AI泛滥污染中文互联网:滥用AI毁了AI自身插图15

AI泛滥污染中文互联网:滥用AI毁了AI自身插图16

AI泛滥污染中文互联网:滥用AI毁了AI自身插图17

AI泛滥污染中文互联网:滥用AI毁了AI自身插图18

AI泛滥污染中文互联网:滥用AI毁了AI自身插图19

AI泛滥污染中文互联网:滥用AI毁了AI自身插图20

最新快讯

2026年03月03日

17:05
2026年3月,上海易慕峰生物科技有限公司宣布完成近2亿元人民币Pre-IPO轮融资。本轮融资由高榕创投、济峰资本领投,深天使、明道投资跟投,老股东约印医疗基金持续加注,华兴资本担任独家财务顾问。公司聚焦实体瘤免疫细胞治疗,首创“化实体瘤为血液瘤”临床策略,依托Peri Cruiser®、SNR及T-Booster等技术平台,提升CAR-T产品安全性、抗异...
17:05
微新创想:2026年3月3日,大昌华嘉特色原料部与意大利企业ASSESSA正式签署协议,获得其产品在中国大陆的独家分销权。此次合作不仅涵盖了食品、营养及个人护理等多个领域,还特别聚焦于特色配料的供应与推广。通过这一重要举措,大昌华嘉进一步巩固了其在高端功能性原料市场中的竞争优势。 微新创想:此次独家分销权的获得,是大昌华嘉持续优化供应链、提升客户服务能力的重...
17:05
微新创想:Keep发布2025财年盈利预告 2026年3月3日,运动科技公司Keep发布了其2025财年的盈利预告。根据预告内容,公司预计在截至2025年12月31日的财年中,实现经调整净利润约2500万元。这是Keep自上市以来首次在年度层面实现经调整净利润为正的成绩,标志着公司在财务表现上取得了重要突破。 与此同时,公司拥有人应占亏损收窄至7200万元,...
17:05
微新创想:近日,社交媒体账号“Vice City Alligator”发布了一段疑似《GTA 6》早期开发阶段的视频。视频内容显示的是罪恶都市中一座跨海岸的立交桥以及一辆驶过桥上的火车,车身印有“啤士瓦舌”的广告。这一画面引发了玩家和媒体的广泛关注,因为“啤士瓦舌”是《GTA 3》中著名的品牌,曾在游戏中扮演重要角色。 据该账号发布者透露,这段视频是由其一位...
17:05
微新创想:2026年3月,Meta在美国部分网页版Meta AI用户中测试新购物研究功能。这项功能通过分析用户的地理位置、性别以及兴趣偏好,为他们推荐相关商品。用户可以在轮播图中浏览这些商品,每项商品都包含品牌、价格和官网信息,并配有简洁明了的推荐理由。目前该功能尚未支持直接支付,仅提供跳转链接,用户需前往商品页面完成购买操作。 公司方面确认,这一功能仍处于...
17:05
微新创想:2026年3月3日,由我国牵头制定的国际标准《干细胞数据的核心特征》正式发布。该标准由国家标准委发布,填补了该领域国际标准的空白。这一重要进展不仅体现了我国在干细胞研究领域的国际影响力,也为全球干细胞科学的发展提供了统一的技术规范和指导原则。 微新创想:标准适用于干细胞基础研究、临床转化及产业发展,旨在规范数据采集、描述与共享的流程。通过建立统一的...
17:01
微新创想:大模型战场的硝烟正从“作诗写代码”烧向“带货卖衣服”。2026年3月3日据彭博社报道社交巨头Meta正在其AI聊天机器人中秘密测试一项购物研究功能。这项功能的推出标志着扎克伯格正式向OpenAI(ChatGPT)和Google(Gemini)的电商领地发起反攻试图利用其独有的社交数据护城河重塑AI购物体验。 核心体验基于社交画像的“上帝视角”不同于...
16:34
微新创想:2026年3月,浙江杭州的生物制药企业新码生物完成6.21亿元C轮融资 本轮融资由中信信慧基金、嘉兴普华、东莞新兴战投、明州基金、绍兴滨海新区产业基金及浙鑫玖号等六家战略投资者共同参与,合计认购公司约16.4018%股权 新码生物专注于生物制品研发与生产,覆盖基因工程构建、细胞培养、毒素合成、ADC偶联、制剂灌装及临床前与临床研究全链条 本轮融资将...
16:34
微新创想:3月3日,万联易达集团正式上线新型物流撮合交易平台“易达宝”。该平台面向全国货运市场,致力于优化物流资源配置,提高行业整体效率。平台通过整合历史交易数据、实时路况信息以及供需波动情况,构建了动态信用评价与智能定价机制,为物流交易提供更加精准和可靠的决策支持。 微新创想:依托先进的数据分析技术,易达宝能够自动筛选并沉淀优质运力资源,确保每一次交易都基...
16:34
微新创想:3月3日,合肥肥东福朋喜来登酒店在合肥市东风大道与清洛河路交口正式开业。该酒店由万豪国际集团管理,共设159间客房及套房,配备智能家居、55英寸电视、独立淋浴间及高速Wi-Fi。 酒店内部设有四层创意餐饮空间“玩啤食社”,提供中西融合及本地美食,兼备社交与商务功能。无论是朋友聚会还是商务洽谈,都能在这里找到合适的场景。 酒店地理位置优越,毗...
16:34
微新创想:3月2日,世界移动通信大会(MWC)在西班牙巴塞罗那盛大开幕。作为全球最具影响力的通信技术盛会之一,MWC吸引了来自世界各地的科技企业与行业领袖。智元机器人(AGIBOT)在此次大会上亮相,其全系列具身机器人吸引了众多参观者的目光,并在展会现场获得了西班牙国王费利佩六世的接见,标志着公司在国际舞台上的影响力不断提升。 微新创想:此次参展,智元机器人...
16:34
微新创想:2025年,海信以57.1%的市场份额,连续第三年(2023–2025)登顶全球百吋及以上电视出货量榜首 该数据由市场研究机构Omdia发布,覆盖全球主要电视市场 海信凭借在激光电视、ULED X等大尺寸高端显示技术的持续投入与量产能力,巩固了其在超大屏领域的领先地位 此举凸显中国企业在高端显示赛道的全球竞争力提升