
近日,《芝加哥论坛报》正式向纽约联邦法院提起诉讼,将人工智能搜索引擎公司 Perplexity 推上被告席。这场诉讼的核心争议在于 Perplexity 在未获得授权的情况下,大规模抓取并利用了《论坛报》的新闻内容,不仅绕过了报社的付费墙机制,还在其产品中直接呈现与原文高度相似的内容生成结果。
根据《论坛报》提交的详细诉状,报社律师团队早在今年10月中旬便已正式致函 Perplexity,要求其就内容使用情况作出说明。Perplexity 的律师在回应中试图淡化责任,声称公司并未将《论坛报》的文章作为模型训练数据,但承认”可能存在部分非逐字的的事实性摘要”。然而,《论坛报》的律师团队迅速反驳,指出 Perplexity 提供的内容并非简单的摘要,而是与原文惊人相似的深度复制。这场法律纠纷还特别关注了 Perplexity 的核心技术——检索增强生成(RAG)系统。
按照设计原理,RAG 技术本应通过引用经过验证的数据源来减少模型偏差,确保信息的准确性和权威性。但《论坛报》的指控直指 Perplexity 在未获授权的情况下,将其新闻内容非法纳入 RAG 数据来源体系。诉状中更揭露了 Perplexity 的 Comet 浏览器存在严重侵权行为,该浏览器能够轻易绕过付费墙,向用户展示报社文章的完整内容摘要,直接损害了报社的合法收益。

值得注意的是,这场诉讼并非孤例。《论坛报》所属的 MediaNews Group 和 Tribune Publishing 旗下共有17家新闻机构,这些机构在今年4月已联合起诉 OpenAI 和微软,指控其未经授权使用训练数据。其中9家媒体更是在去年11月发起了针对类似问题的诉讼。这一系列法律行动清晰地反映出传统媒体行业对人工智能公司内容使用的普遍担忧正在不断升级。
目前,Perplexity 尚未对《论坛报》的指控作出正式回应,也未回应 TechCrunch 的置评请求。然而,这家公司近期已面临多起法律挑战,包括来自 Reddit、道琼斯公司等多起侵权诉讼,以及亚马逊发出的停止侵权通知函,后者警告其购物类 AI 浏览技术可能违反相关法律法规。
随着越来越多的媒体机构开始关注 AI 搜索引擎与内容抓取的边界问题,本案或将引发法院对 RAG 技术在版权法律框架下责任认定的深度审视。这场诉讼不仅关乎《论坛报》等传统媒体的合法权益,更可能为整个 AI 内容生态的版权治理提供重要参考。未来,如何平衡技术创新与内容保护,将成为行业必须共同面对的重要课题。
