在这个信息爆炸的时代,没有人希望生活在一个被虚假信息充斥的世界里。然而,随着人工智能技术的飞速发展,我们正面临着前所未有的挑战——AI生成内容的泛滥正在逐渐侵蚀着真实与虚假的边界。

编者按:本文由微信公众号雷科技(ID:leitech)独家授权发布,编辑失魂引,内容经微新创想精心整理。2024年2月,ChatGPT与微软Bing AI的相继爆发,引发了全球范围内的广泛关注,相关概念股股价应声而动。知乎作为国内知名问答社区,因其海量问答数据被广泛应用于生成式AI的训练,股价一度飙升31%。随后,百度文心一言的问世再次推动了股价的上涨。然而,好景不长,进入4月,一位知名程序员在V2ex社区发帖表示担忧:“ChatGPT可能成为知乎最大的威胁。”这一观点迅速引发共鸣,许多人发现知乎平台上充斥着大量AI生成的回答,其中不乏缺乏实质内容的观点,甚至出现了“一本正经胡说八道”的现象。

AIGC泛滥如何破局 用AI检测AI生成内容插图

与此同时,AI生成内容的“领土”正在从互联网向现实世界扩张。在海外技术社区Hacker News上,有人指出一家网红营销机构网站上的博文出现了“抱歉,作为一种AI语言模型,我无法预测未来的事件或趋势”的提示。类似的声音还出现在卡塔尔的购物中心目录和芬兰的一家电子产品商店网站等地方。这些只是冰山一角,更多被AI精心伪装的虚假内容,或许正潜伏在我们尚未察觉的角落。

回想起今年3月,网络上流传出一系列“特朗普被捕”的AI生成照片,尽管后续报道证实其为虚假,但在最初的热传阶段,仍有大量网友信以为真。而后来出现的“甘肃火车事故”“八角大楼被袭”等假新闻,更是不断挑战着人们的认知底线。过去半年,ChatGPT等生成式AI已经证明,它们能够无视事实真相,批量制造似是而非的内容。更令人担忧的是,这些AI生成的虚假内容会被其他AI学习并进一步加工,从而创造出更加逼真的假象。甚至,AI还能根据用户的个人偏好,量身定制虚假信息。这种AI驱动的假新闻生产和再生产,未来可能对舆论场造成毁灭性打击。

AIGC泛滥如何破局 用AI检测AI生成内容插图1

更大的隐忧在于,如果互联网乃至现实世界都被AI生成的虚假内容所淹没,整个社会秩序都可能陷入崩溃。从文字到图片再到声音,如今AI生成的内容与真人创作的内容之间的界限已经变得模糊不清,就像我们大多数人已经无法区分AI孙燕姿、AI Drake与真人声音的差别。而AI的进化速度更是令人瞠目结舌。几个月前,人们还在抱怨AI绘画“不会画手”,但Midjourney V5新版本的推出彻底打破了这一认知,AI不仅能够精准绘制手部细节,各种细节的逼真度也达到了前所未有的高度。就连孙燕姿本人也在回应AI歌手时坦言:“你可能会说还能分辨出区别,因为它没有情绪,没有音调和呼吸的变化。但我怀疑这只是暂时的。”

因此,问题已经不再是我们能否分辨AI生成的内容,而是该如何有效识别。人工识别显然不切实际,不仅准确率难以保证,还需要投入巨大的人力资源。去年年底,ChatGPT一经发布,就被许多学生用于生成论文,并取得了不错的效果,从而引发了更广泛的使用浪潮。随后,巴黎政治学院等全球知名学府纷纷出台禁令。但据Study.com的一项调查显示,1000名18岁以上的学生中,超过89%的人都在使用ChatGPT完成作业。面对这一挑战,或许最好的办法就是用“魔法”打败“魔法”。

AIGC泛滥如何破局 用AI检测AI生成内容插图2

众所周知,一个社区的核心在于用户之间的真诚交流,而AI生成的虚假内容一旦泛滥,很容易摧毁这种交流氛围。以V2ex为例,其站长Livid为了辨别AI生成的灌水内容,甚至直接向AI提问“是否由AI生成”,以此作为封禁用户的依据。然而,这种方法仍然存在诸多不确定性。

就在ChatGPT刚推出时,OpenAI联合哈佛大学等机构推出了GPT-2 Output Detector,试图通过基于GPT-2模型微调输出的方式检测AI生成内容。但这一工具对基于GPT-3.5的ChatGPT效果不佳。于是,OpenAI在2月1日又推出了“AI生成内容识别器”,本质上是一个辨别真实与AI生成文本的分类器。然而,OpenAI在博客中坦诚,该识别器的检测成功率仅为26%,可能还不如网友的随机猜测。国内也出现了类似的AIGC-X检测工具,由人民网下属传播内容认知国家重点实验室等机构联合研发,号称对中文文本检测准确率超过90%,但实际效果并不尽如人意。

AIGC泛滥如何破局 用AI检测AI生成内容插图3

尽管如此,到目前为止,所有试图用AI对抗AI的努力都没有取得成功。这一路径本身也存在争议,有人将其形容为新时代的“自相矛盾”——用最强的矛去攻击最强的盾。相比之下,“水印”技术逐渐成为越来越普遍的选择。在5月召开的谷歌I/O大会上,谷歌宣布所有AI生成的图片都将内嵌不可见的水印,这些水印可以通过谷歌搜索引擎等工具读取并标注出来,从而提醒用户该图片由AI生成。随后,Shutterstock、Midjourney等AI应用也纷纷宣布支持这一新的标记方法。然而,AI生成文字内容的标记方案仍在探索中。OpenAI也在考虑在生成的文本中加入数字水印,以降低模型被滥用的风险。但OpenAICEO Sam Altman在接受采访时提醒,不存在完美的AI生成文字识别工具,因为人们总会调整修改文本,而且还会出现新的修改工具。

写在最后,之前在某个论坛上看到一位网友的帖子,他通过搜索引擎来到知乎,阅读了一半的回答后突然意识到这可能是AI生成的,顿时感到一阵反胃。关键在于,即使我们主动使用ChatGPT等生成式AI,也可能会对其真实性和可靠性有所预期,但显然我们无法阻止其他人发布AI生成的虚假内容。打个比方,如果对历史不太了解的人,在知乎上看到一篇关于亚瑟王的详细讨论,可能会误以为亚瑟王是真实存在的历史人物,甚至是一位女骑士(型月作品中的设定)。但坦白说,除了那些明显带有AI风格的文本,我们很难在陌生领域分辨出内容是否由AI生成,唯一能做的,可能就是更加审慎地对待我们所看到的一切。

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月07日

07:47
2026年2月6日,苹果更新《App审核指南》,将“随机或匿名聊天”类应用列入高风险名单,允许无需通知即予移除。此举针对Chatroulette式体验及缺乏实名与审核机制的UGC社交应用,旨在遏制色情、欺凌、人身威胁等内容。新规明确,若App核心功能导向此类行为,将不被允许上架。开发者须强化实名认证、实时内容审核及举报响应机制,否则面临即时下架风险。
07:47
2026年2月6日,苹果WebKit团队发布Interop 2025年度回顾。该项目由苹果、谷歌、微软、Mozilla等联合发起,旨在提升跨浏览器兼容性。2025年,团队聚焦CSS、JavaScript等20个关键领域,Safari测试得分从年初43分升至99分,为所有参测浏览器中涨幅最大。行业整体通过率由29%升至97%,四大浏览器实验版均达99%。In...
07:47
2月7日5时20分,印尼西南群岛(南纬7.80度、东经130.35度)发生5.7级地震,震源深度10千米。此次地震由权威地震监测机构正式测定,属浅源地震,可能引发局部震动及次生影响。目前暂无人员伤亡和财产损失报告,当地未发布海啸预警。相关部门正评估灾情并加强监测。
07:47
2026年2月6日,科技媒体Appleinsider指出,Apple Music推荐算法缺乏应对临时收听行为的防御机制。用户偶然点播节日歌曲、游戏原声或儿歌后,个人电台与新歌推荐将持续数周偏离原有偏好。纠偏需手动关闭‘使用听歌历史’或启用专注模式,但操作隐蔽、依赖用户主动执行。一次无心播放《Yo Gabba Gabba》等非典型内容即可能触发长期误判。相较...
07:47
2026年2月6日,Take-Two首席执行官施特劳斯·泽尔尼克透露,《GTA6》营销工作将于2026年夏季正式启动。此举被业界视为游戏有望按计划于2026年11月发售的重要信号。此前该作已从2025年秋季跳票。泽尔尼克强调公司每日监控开发进度,并称营销将“克制细腻”,凸显其艺术属性而非普通商品。目前R星仅发布两支预告片、设定图及官网信息,尚未公开实机演示...
07:16
2026年2月6日,苹果公司计划向第三方语音助手开放CarPlay部分权限,允许用户通过车机直接调用兼容的AI语音应用。此举旨在缓解新版个性化Siri进展缓慢带来的用户体验压力。目前Siri仍为默认且不可替换的唤醒助手,第三方助手需通过对应App启动,不支持更改唤醒词或替换Siri物理按钮。该功能预计在未来几个月内上线,将改善此前依赖iPhone+车载免提...
06:16
2026年2月7日,人工智能芯片初创公司SambaNova完成3.5亿美元新融资。美国私募股权公司Vista Equity Partners参与本轮融资,英特尔公司承诺出资至多1.5亿美元。本轮融资旨在加速SambaNova在大模型推理芯片及软件栈领域的研发与商业化落地。SambaNova总部位于美国加州帕洛阿尔托,长期聚焦AI专用硬件架构。此次融资后,公...
05:16
2026年2月7日,苹果公司宣布计划允许外部语音控制型人工智能聊天机器人接入CarPlay车载系统。此举旨在提升车载交互体验,支持开发者基于iOS生态构建兼容的AI语音服务。接入将通过新API实现,强调隐私保护与本地化处理,不依赖持续云端通信。目前尚无具体上线时间表,首批合作方尚未披露。该调整标志着苹果在智能座舱领域进一步开放生态。
02:43
2026年2月6日,法国达能公司在荷兰主动召回多个批次诺优能婴幼儿配方奶粉。此次行动系因欧盟最新下调蜡样芽孢杆菌毒素限值,达能经与荷兰食品安全主管部门协调后实施。召回范围限于在荷销售的特定批次产品,不涉及其他国家市场。公司表示已启动追溯与消费者通知机制,并强调问题产品尚未报告健康损害案例。
02:43
2月7日,英伟达CEO黄仁勋在公开表态中指出,Anthropic和OpenAI目前已实现盈利。他强调,当前大规模人工智能资本支出既合理又必要,以支撑长期技术基础设施建设。黄仁勋判断,构建完整、可靠的人工智能生态体系需7至8年时间。该言论发布于北京时间2026年2月7日,反映了头部企业对AI产业化进程的阶段性评估与战略预判。
02:43
2026年2月7日,英伟达首席执行官黄仁勋公开表示,公司与OpenAI之间不存在任何矛盾纷争。他强调,OpenAI正积极采用英伟达最新一代AI芯片以支撑其大模型研发与部署。此举凸显双方在高性能计算与人工智能基础设施领域的深度合作。黄仁勋未透露具体芯片型号及供货细节,但确认合作持续稳定推进。
00:11
2026年1月13日,沪铝主力合约价格首次突破2.5万元/吨,创历史纪录。受下游建筑、轨道交通等领域订单增长推动,云南多家电解铝企业满负荷运行。以云南铝业为例,其年产能308万吨,铝锭日产量约3500吨,当前实现当日生产、当日发运,库存为零。满产状态自2026年初持续至今,反映终端需求强劲及供应链高效运转。