一项突破性研究揭示,人工智能模型仅需通过两本书的微调训练,便能精准复现著名作家的独特写作风格,甚至其生成文本的读者喜爱度超越了人类专业模仿者。这项由圣ony Brook大学与哥伦比亚法学院联合开展的研究,深入探索了AI在文学创作领域的潜力,选取了包括诺贝尔奖得主韩江、布克奖得主萨尔曼·鲁西迪在内的50位知名作家的风格进行创作实验。
在研究过程中,159名参与者(其中28名写作专家、131名非专家)通过众包平台Prolific对AI生成的文本段落进行匿名评判。值得注意的是,所有参与者均不知晓所评判文本的创作者是人类还是AI。研究团队采用了两种核心的AI训练方法:上下文提示与特定作者微调。在上下文提示实验中,研究团队运用了GPT-4o、Claude3.5Sonnet和Gemini1.5Pro三种主流AI系统,给予它们相同的指令和样本文本进行创作对比。而在特定作者微调实验中,由于仅有GPT-4o支持所需的API功能,研究团队为30位作家购买了数字版书籍,并为其分别训练了独立的AI模型。
在评判环节,参与者需比较两段文本并选择更优秀的一段。对于风格评估,研究团队还会提供原作者的真实摘录作为参考。研究结果显示,在未经过微调的上下文提示实验中,专家群体更倾向于人类创作的文本,而非专家的选择则呈现分散态势。然而,在经过特定作者微调后,专家在风格评估上对AI生成文本的偏好提升了八倍,在写作质量评估上对AI文本的选择比例也达到了人类文本的两倍。
此外,研究还发现现代AI检测工具对标准AI输出的识别率高达97%,但对经过微调的输出则仅有3%的识别率。更令人惊讶的是,训练数据的数量并不影响最终效果——即使是仅出版过两本书的作家,其风格也能被AI精准模拟。专家与非专家在评判标准上的趋同,表明经过微调的AI文本质量已获得普遍认可。

从经济效益角度看,专业写作服务费用高达2.5万美元,而训练AI模型的成本仅需约81美元,这一对比凸显了AI在文学创作领域的巨大潜力。这些研究成果恰逢美国法院正在审理有关AI如何获取和使用版权材料的诉讼案件,研究团队建议,对于专门模仿特定作家的AI应用,法律应有明确区分,或禁止AI复制个人作家的独特风格,或要求对AI生成文本进行清晰标识。
这项研究不仅展示了AI在文学创作领域的惊人能力,更可能对未来的版权法及合理使用原则的辩论产生深远影响。AI模型仅需两本书便可生成知名作家的写作风格,经过微调后,读者对AI生成文本的偏好显著提高,这些发现无疑将重新定义人类与AI在创意领域的互动边界。
