滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图

编者按:本文来自微信公众号量子位(ID:QbitAI),作者:金磊 尚恩,微新创想经授权转载,头图来自摄图网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图1

污染中文互联网,AI成了“罪魁祸首”之一。事情是这样的。最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:象鼻山是否有缆车?Bing也是有问必答,给出了看似挺靠谱的答案:在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。甚至能在1分钟之内回答2个问题。在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……并且他认为,这就是导致Bing输出错误答案的原因:这个AI疯狂地污染中文互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图2

“AI污染源”,不止这一个那么被网友发现的这位AI用户,现在怎么样了?从目前结果来看,他已经被被知乎“判处”为禁言状态。但尽管如此,也有其他网友直言不讳地表示:不止一个。若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图3

事实上,诸如此类的“AI污染源”不止是在这一个平台上有。就连简单的科普配图这事上,AI也是屡屡犯错。网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。甚至各类AI生成的假新闻也是屡见不鲜。例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。警方均已对他们采取了刑事强制措施。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图4

但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。程序员问答社区Stack Overflow便是一个例子。早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。当时官方给出来的理由是这样的:(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。因为从ChatGPT得到错误答案的概率太高了!Stack Overflow进一步阐述了这种现象。他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。一言蔽之,AI污染了社区环境。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图5

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。不过,还是老问题,答案的准确性如何,就不得而知了。但这种现象背后,其实还隐藏着更大的隐患。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图6

滥用AI,也毁了AI

AI泛滥污染中文互联网:滥用AI毁了AI自身插图7

AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……而如此滥用AI,反过来也是一种自噬。最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图8

对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮·伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图9

基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图10

话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图11

参考链接:[1]https://www.v2ex.com/t/948487[2]https://twitter.com/oran_ge/status/1669160826186633219[3]https://www.qbitai.com/2022/12/40167.html[4]https://arxiv.org/abs/2305.17493v2[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250[6]https://futurism.com/ai-generates-fake-news

AI泛滥污染中文互联网:滥用AI毁了AI自身插图12

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

AI泛滥污染中文互联网:滥用AI毁了AI自身插图13

AI泛滥污染中文互联网:滥用AI毁了AI自身插图14

AI泛滥污染中文互联网:滥用AI毁了AI自身插图15

AI泛滥污染中文互联网:滥用AI毁了AI自身插图16

AI泛滥污染中文互联网:滥用AI毁了AI自身插图17

AI泛滥污染中文互联网:滥用AI毁了AI自身插图18

AI泛滥污染中文互联网:滥用AI毁了AI自身插图19

AI泛滥污染中文互联网:滥用AI毁了AI自身插图20

最新快讯

2025年08月25日

17:42
在近日举办的闲鱼夜市直播间一场备受瞩目的拍卖会上,一枚品相极为罕见的乾隆通宝雕母币以1282648元的天价成交,不仅刷新了国内互联网直播拍卖古钱币的交易纪录,更将古钱币收藏市场的热度推向了新的高潮。这枚雕母币作为古代铸币的母版,其历史价值和艺术价值不可估量,而存世量更是稀少至极,目前全球范围内仅存不足三十枚,每一枚都堪称无价之宝。此次拍卖的雕母币保存状况极佳...
17:42
2025年8月25日,井松智能正式发布其2025年半年财务报告,数据显示公司上半年营业收入达到3.57亿元,较去年同期实现了3.18%的稳步增长。然而,令人意外的是,归母净利润却仅为49.87万元,同比大幅下滑98.05%,基本每股收益更是低至0.01元。这一显著的反差背后,主要源于智能仓储行业的激烈竞争格局以及招标价格下行的双重压力。 为稳固市场地位,...
17:42
2025年8月25日,科德教育正式发布一则重要异动公告,宣布其在2023年4月通过增资及股权转让的方式,成功出资1.3亿元人民币参股中昊芯英(杭州)科技有限公司,并持有该公司5.53%的股份。此次投资行为旨在拓展公司在科技教育领域的布局,进一步强化与高科技企业的合作生态。 公告中明确指出,科德教育此次参股中昊芯英并不构成控股关系,因此该投资不会纳入公司合并财...
17:42
华依科技(688071.SH)正积极布局全球市场,以发行H股并申请在香港联交所主板上市为重要抓手,全面加速国际化战略进程。此举旨在进一步扩大品牌国际影响力,增强全球竞争力,为公司的长远发展奠定坚实基础。目前,公司已启动相关筹备工作,正与多家专业机构就具体方案展开深入磋商。关于发行规模、上市时间等关键细节,相关方仍在积极论证与协调中,预计将尽快公布最终方案。此...
17:42
2025年8月25日,金晶科技(股票代码:600586)正式发布其2025年半年财务报告,数据显示公司上半年营业收入总额为23.94亿元,相较去年同期大幅下滑32.56%。更令人关注的是,归母净利润出现显著亏损,达到9626.95万元,与去年同期相比由盈转亏,基本每股收益更是跌至-0.0681元。这一业绩下滑趋势,主要受到当前复杂市场环境及行业周期性波动的影...
17:42
花江峡谷大桥于今日下午5时左右圆满完成荷载试验,各项检测数据均表现正常,桥梁整体处于理想的弹性工作状态。此次为期5天的严苛测试不仅验证了桥梁设计的科学性与施工质量,更标志着这座超级工程距离正式通车又迈出了至关重要的一步 这座全长2890米的宏伟桥梁,其主桥跨径达到1420米,桥面至水面高度更是高达625米,一旦建成,其主桥跨径与高度两项关键指标均将刷新世...
17:42
2025年8月25日清晨,美股市场尚未正式开盘,英特尔公司的股价已逆势上扬,涨幅超过3个百分点。这一积极表现主要源于市场对英特尔近期财务报告的正面解读以及对其未来发展潜力的乐观预期。随着半导体行业竞争格局的变化,投资者开始重新评估英特尔在芯片市场的综合竞争力,并对其展现出的复苏迹象给予了高度认可。这种信心的回归直接转化为资本市场的积极反馈,推动公司股价稳步攀...
17:42
2025年上半年,青山纸业交出了一份颇具亮点的财务成绩单。公司实现归属于母公司股东的净利润高达5607.9万元,同比增长1.74%,展现出稳健的盈利能力。尽管整体营收面临压力,但净利润的逆势增长为市场投下了一颗信心炸弹。 报告期内,青山纸业营业收入为12.1亿元,较去年同期下降15.27%。这一数据反映出行业竞争加剧和市场环境变化带来的挑战。然而,在营收规模...
17:42
2025年8月25日,华之杰正式发布战略投资公告,宣布将以有限合伙人的身份,投入自有资金1000万元参与投资上海音波迭代硅基创业投资合伙企业(有限合伙)。这一产业基金计划的总募集规模高达3亿元人民币,其投资方向将精准聚焦于具身智能及其产业链的上下游相关领域,涵盖技术创新、产品研发、市场应用等关键环节。 此次投资是华之杰在智能科技领域布局的重要一步,旨在通过资...
17:42
2025年8月25日,春秋航空正式就网络上广泛传播的“夏季客舱内冷凝水汽与客舱销售强行关联”的说法作出权威澄清。针对部分旅客将正常物理现象误解为商业营销手段的疑虑,公司发布声明明确指出,夏季客舱内出现的冷凝水汽现象,完全是由于外界潮湿空气与空调系统吹出的干冷空气相遇时产生的正常物理反应。春秋航空特别强调,这种现象通常在飞机起飞后的短时间内便会自然消散,与任何...
17:42
2025年上半年,纳睿雷达交出亮眼业绩答卷,营业收入突破1.55亿元大关,同比增长率高达112.84%,展现出强劲的增长势头;净利润更是达到5694.66万元,同比激增866.97%,盈利能力实现跨越式提升。为回馈股东厚爱,公司宣布拟每10股派发现金红利0.5元(含税),彰显稳健的股东回报政策。净利润的显著增长主要得益于三大核心因素:新签相控阵水利测雨雷达合...
17:42
上周(8月18日至8月24日),A股市场IPO审核节奏保持平稳,无新增企业提交上市申请。截至本周五(8月24日),今年累计受理的IPO项目已达179家,显示出资本市场在常态化注册制下的稳步推进态势。 目前,全国各大交易所的审核队列呈现均衡发展态势。上交所共在审企业63家,其中主板26家,科创板37家,涵盖了科技创新与传统产业的双重布局;深交所的在审企业数量为...