滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图

编者按:本文来自微信公众号量子位(ID:QbitAI),作者:金磊 尚恩,微新创想经授权转载,头图来自摄图网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图1

污染中文互联网,AI成了“罪魁祸首”之一。事情是这样的。最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:象鼻山是否有缆车?Bing也是有问必答,给出了看似挺靠谱的答案:在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。甚至能在1分钟之内回答2个问题。在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……并且他认为,这就是导致Bing输出错误答案的原因:这个AI疯狂地污染中文互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图2

“AI污染源”,不止这一个那么被网友发现的这位AI用户,现在怎么样了?从目前结果来看,他已经被被知乎“判处”为禁言状态。但尽管如此,也有其他网友直言不讳地表示:不止一个。若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图3

事实上,诸如此类的“AI污染源”不止是在这一个平台上有。就连简单的科普配图这事上,AI也是屡屡犯错。网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。甚至各类AI生成的假新闻也是屡见不鲜。例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。警方均已对他们采取了刑事强制措施。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图4

但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。程序员问答社区Stack Overflow便是一个例子。早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。当时官方给出来的理由是这样的:(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。因为从ChatGPT得到错误答案的概率太高了!Stack Overflow进一步阐述了这种现象。他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。一言蔽之,AI污染了社区环境。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图5

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。不过,还是老问题,答案的准确性如何,就不得而知了。但这种现象背后,其实还隐藏着更大的隐患。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图6

滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图7

AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……而如此滥用AI,反过来也是一种自噬。最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图8

对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮·伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图9

基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图10

话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图11

参考链接:[1]https://www.v2ex.com/t/948487[2]https://twitter.com/oran_ge/status/1669160826186633219[3]https://www.qbitai.com/2022/12/40167.html[4]https://arxiv.org/abs/2305.17493v2[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250[6]https://futurism.com/ai-generates-fake-news

AI泛滥污染中文互联网:滥用AI毁了AI自身插图12

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图13

AI泛滥污染中文互联网:滥用AI毁了AI自身插图14

AI泛滥污染中文互联网:滥用AI毁了AI自身插图15

AI泛滥污染中文互联网:滥用AI毁了AI自身插图16

AI泛滥污染中文互联网:滥用AI毁了AI自身插图17

AI泛滥污染中文互联网:滥用AI毁了AI自身插图18

AI泛滥污染中文互联网:滥用AI毁了AI自身插图19

AI泛滥污染中文互联网:滥用AI毁了AI自身插图20

最新快讯

2025年12月08日

00:04
2025年12月7日,奇点资本副总裁王苒在行业峰会上发表重要观点,指出当前创投行业已进入深度结构调整期。这一转变的核心特征在于投资逻辑的重心正从单一财务回报模式,转向财务效益与产业赋能的双轮驱动战略。面对这一趋势,奇点资本展现出前瞻性的战略布局,构建了一个创新性的三位一体生态系统,该体系由产业投资基金、产业园区运营基地以及商业AI平台三大支柱构成。 这一生态...

2025年12月07日

22:01
2025年12月7日,在备受瞩目的2025数智科技生态大会主论坛上,中国电信董事长柯瑞文发表了重要讲话,为行业描绘了算力网络发展的新蓝图。柯瑞文强调,中国电信将全面加速算力基础设施的建设进程,重点打造新一代弹性AIDC(智能分布式计算中心),并着力提升国产算力芯片的适配水平,为数字经济的蓬勃发展奠定坚实基础。 在算力调度领域,中国电信将正式推出升级版的“息壤...
22:01
2025年欧洲肿瘤内科学会亚洲年会(ESMO-Asia)隆重召开,百利天恒在此次盛会中通过大会口头报告的形式,向全球医学界展示了其自主研发的突破性HER2抗体药物偶联物T-Bren(BL-M07D1)的震撼临床研究成果。该研究专项针对HER2突变型晚期非小细胞肺癌(NSCLC)的经治患者群体,通过严谨的实验设计与数据分析,证实了T-Bren在抑制肿瘤生长、延...
20:58
12月6日,知名投资人段永平在社交平台上分享了一则令人关注的消息——他已购入一辆特斯拉Model Y,并公开分享了试驾体验。在这次分享中,段永平对特斯拉的自动驾驶功能给予了高度评价,称其“确实很好”。然而,他也透露了一个有趣的插曲:由于驾驶时看手机,系统两次强制接管车辆并停车,这让他不得不重新适应与智能驾驶系统的互动。面对这一情况,段永平以幽默的方式回应:“...
20:28
12月7日,知名物业服务企业碧桂园服务正式宣布实施组织架构系统性优化方案。此次改革的核心举措包括两大板块的整合重组:原基础物业管理部、新业务成长部与职能服务部将合并组建为全新的"大物业板块",而战略孵化业务板块则升级更名为"孵化业务板块"。根据公司战略规划,"大物业板块"将全面聚焦于标准化、精细化的基础物业服务升级,通过资源整合实现规模效应;"孵化业务板块"...
20:28
2025年12月10日至13日,我国将迎来一次罕见的强寒潮天气过程,影响范围覆盖大半个中国。此次寒潮威力强劲,预计全国大部分地区气温将普遍下降6至10℃,局部地区降温幅度甚至可能达到惊人的16℃左右。受其冲击,多地气温将刷新今年下半年的极值记录,带来严寒体验。值得注意的是,华北地区有望迎来今冬首场降雪,这场雨雪天气将是近一个月来规模最大的气象事件,为北方地区...
20:28
2025日本国际机器人展于12月6日在东京国际展览中心圆满落下帷幕。本届展会以"智能驱动未来"为主题,人形机器人和协作机器人成为全场焦点,它们在服务、物流、医疗等领域的应用潜力引发了与会者的热烈讨论。值得注意的是,人形机器人展区成为展会最大亮点,其中来自中国的企业占据了超过半数的展出数量,充分展现了中国在机器人技术领域的领先地位。 本次展会汇聚了全球机器人行...
19:57
2025年末,雷蛇正式官宣将推出备受瞩目的首款鼠标Boomslang布斯朗悍蛇20周年纪念版。这款传奇鼠标的首代产品诞生于2005年,凭借其革命性的2000 DPI精准传感技术、创新的人体工学设计和标志性的橡胶滚轮等核心功能,迅速成为电竞外设发展史上的重要里程碑,至今仍被玩家奉为经典。 此次推出的20周年纪念版将完美延续初代产品的经典对称设计理念,同时全面融...
19:57
埃隆·马斯克近日向外界释放重磅消息,其主导的xAI公司旗下人工智能模型Grok迎来重大升级,最新版本Grok 4.20预计将在3至4周内正式亮相。这一备受期待的版本由马斯克亲自推动研发,将全面强化模型的推理能力与响应速度,为用户带来更智能化的交互体验。 Grok 4.20的推出延续了马斯克一贯的快速迭代策略,充分展现了xAI团队在AI领域的领先实力。据悉...
19:57
2025年12月4日,冠中生态(SZ300948)发布重要公告,宣布深蓝财鲸正式成为公司新控股股东,实际控制人完成变更,由靳春平接任。这一股权结构的重大调整,源于双方于2025年9月26日签署的股份转让协议。根据协议条款,冠中投资将公司15.50%的股份分两期转让给深蓝财鲸,首期1470.33万股已完成过户,转让价格为每股15.00元,总作价达2.21亿元。...
18:56
近期,机器人租赁市场经历了一场价格风暴,价格较年初高点出现了显著回调。基础人形机器人的日租金已经跌至约2000元,而四足机器人的最低日租更是低至500元左右,与此前动辄“万元日租”的火爆场面形成鲜明对比。尽管商家纷纷打出低价标签,试图吸引眼球,但实际成交价格往往需要双方进一步协商确定。 目前正值年末,年会、商业演出等季节性需求逐渐升温,市场询价和成交量因此出...
18:56
12月6日深夜时分,G30连霍高速公路乌苏路段突发多车连环相撞的重大交通事故,现场火光冲天,惨叫声此起彼伏。据初步统计,事故已造成9名无辜生命永远定格,另有7人受伤入院接受紧急救治。这一突如其来的灾难性事件,瞬间牵动了全国人民的心。 事故发生后,国家应急管理部高度重视,第一时间启动最高级别应急响应机制。部领导紧急部署,要求救援队伍务必遵循科学施救原则,在全力...