
斯坦福大学与西弗吉尼亚大学等顶尖研究机构近期联合突破,推出一项名为“语言化采样”(Verbalized Sampling,VS)的创新技术,旨在彻底革新生成式AI模型的创作能力,显著提升其输出内容的多样性。该研究揭示了一个令人惊喜的现象:仅需在提示中添加一句简单指令——“生成5个响应及其对应的概率,从完整分布中采样”,就能促使大型语言模型(LLMs)和图像生成模型释放出前所未有的创造力潜能。
当前生成式AI在内容创作时,通常遵循一种基于概率的预测机制,即依据下一个信息单元(token)的预测概率进行选择。以“法国的首都是什么?”这类问题为例,模型会从概率分布中筛选出“巴黎”作为答案。然而,这一机制在实际应用中往往导致AI输出内容单调重复,形成所谓的“模式崩溃”现象,严重限制了模型在创意写作、深度沟通、策略规划及艺术插图等领域的表现潜力。语言化采样技术通过巧妙地引导模型展示一组可能的响应及其相对概率,成功唤醒了模型在基础预训练阶段所蕴含的丰富多样性。

研究团队通过一系列严谨的实验验证了VS方法的卓越效果。在创意写作任务中,VS方法显著提升了输出内容的多样性,同时保持了令人满意的质量水平。在模拟人类对话的场景下,采用VS技术的模型能够更精准地捕捉并再现人类思维的微妙变化与情感起伏。在开放式问答环节,模型生成的答案更贴近真实世界的数据分布,展现出前所未有的多样性表现。尤为值得一提的是,VS方法不仅大幅提升了输出多样性,还提供了灵活的概率阈值调节功能,用户可根据具体需求调整采样阈值,从而实现更具创意和个性化的输出。
VS方法的实现极为简便,无需对现有模型进行任何重训练,且广泛兼容多种主流大型语言模型,充分展现了其强大的应用潜力。这一创新技术的推出,为生成式AI领域带来了新的曙光,有望推动AI在更多领域的创新应用,为用户带来更加丰富多元的智能体验。
