微新创想(idea2003.com) 8月8日电 Prosecraft.io 网站近日宣布暂停运营,这一决定源于其备受争议的数据驱动项目。该平台曾利用小说文本分析字数、被动语态等写作特征,并尝试评估生动性等主观指标。然而,这一基于25,000本受版权保护图书构建的数据库,在引发作者群体强烈抗议后被迫下线。
作者们对 Prosecraft 项目表达了强烈不满。Zach Rosenberg 成为首位在X(原Twitter)平台引发广泛关注的声音。随后,包括Jeff VanderMeer(《南方 Reach 三部曲》作者)、Indra Das(《吞噬者》作者)和Gretchen Felker-Martin(《追捕》作者)在内的众多知名作家纷纷发声。抗议浪潮的兴起,部分源于Prosecraft承认使用了人工智能算法。2018年10月5日,该平台及基于其数据库开发的写作程序Shaxpir的开发者Benji Smith在博客中写道:”我们教会了机器学习算法识别词汇在特定语境中的使用方式,通过分析类似句子和段落中出现的词汇和短语类型。”他同时透露,Shaxpir分析了580万字的小说文本,但未说明数据来源及授权情况。
尽管技术方案与ChatGPT等大型语言模型有所不同,但将生成式LLM算法纳入Prosecraft规划的潜在可能性,已引发作者们的合理担忧。庞大的图书数据库更让这一担忧显得尤为突出。抗议行动后,Smith在Medium上发布长文解释关闭决定。他辩称,尽管项目使用了部分文本,但仅发布了摘要统计数据和少量摘录段落,符合合理使用原则,无需获得原作者同意。
然而,法律界普遍认为,合理使用不适用于未经授权使用完整受版权保护的文学作品作为AI算法的训练数据。这一事件无疑为相关领域敲响了警钟。Smith在长文结尾表达歉意,并暗示未来可能在获得作者授权的情况下重建项目。但社交媒体上的作家们对此表示怀疑,认为这暗示其并未删除图书数据库,数据仍可能被用于训练AI生成与真实作家风格相似的虚假书籍。