
斯坦福大学研究团队在 Cell Press 旗下权威期刊《Patterns》上发布的一项突破性研究,揭示了大型语言模型(LLM)在正式书面沟通领域的惊人渗透率。该研究通过对 Newswire、PRWeb 和 PRNewswire 等主流英文媒体平台的深度分析,发现大量文稿中存在显著的 AI 生成痕迹。研究团队创新性地采用”分布式 LLM 量化框架(Distributional LLM Quantification Framework)”这一统计模型,通过系统性地分析语料库的整体语言特征分布,精准估算出特定时间段内具备 AI 生成特征的文本比例。需要特别指出的是,该技术目前仅适用于英文文本分析,因此研究结果仅反映英文领域 AI 特征的分布情况,并不代表整篇文章完全由 AI 创作。
报告显示的研究数据令人瞩目:去年全年共分析了68.7万条消费者投诉、53.7万篇企业新闻稿、3.04亿份招聘信息以及1.6万篇联合国新闻稿,其中 AI 特征分布呈现明显差异。企业新闻稿中约24%的文稿带有 AI 痕迹;消费者投诉文本中约18%具备 AI 特征;联合国新闻稿中约14%的内容被认定为”几乎由 AI 大模型直接生成或经过大幅改写”;招聘信息中接近10%的内容带有明显 AI 痕迹。

研究结果表明,LLM已深度融入社会各领域的正式文本写作,逐渐成为人们日常书面表达的重要辅助工具。在细分领域分析中,教育程度较低地区的消费者投诉使用 AI 撰写的比例高达19.9%,显著高于教育程度较高地区的17.4%。而在招聘信息方面,中小型企业或初创公司更倾向于使用大模型生成内容,其中约10%至15%的招聘公告包含明显的 AI 痕迹。
研究人员特别强调,随着生成式 AI 技术的持续迭代,其文风正日益接近人类写作风格。这一趋势意味着未来要精确识别 AI 在文本创作中的参与程度将面临更大挑战。该研究不仅揭示了 AI 在正式文本写作中的广泛应用现状,更为未来相关技术监管和内容识别提供了重要参考依据。
