微新创想(Idea2003.com)6月20日 消息:科技巨头Meta近日宣布了一项突破性的语音生成AI模型——Voicebox,但出于安全考虑,该公司决定暂不公开该模型及其代码。据Meta内部评估,Voicebox的强大功能若被公开,可能带来不可预见的潜在风险。
Voicebox被认为是迄今为止最通用的语音生成模型,能够从短短两秒的语音样本中,精准生成六种不同语言的语音输出。Meta表示,该模型未来有望应用于实现“自然、真实”的跨语言翻译,为全球沟通带来革命性突破。与其他文本转语音技术不同的是,Voicebox具备强大的泛化能力,无需针对性训练即可完成语音编辑、噪音消除和风格转换等复杂任务。
值得关注的是,此前谷歌也对其员工发布了严格的内部安全指南。Alphabet要求员工谨慎对待包括Bard在内的聊天机器人,禁止输入任何机密信息。公司担心员工与这些AI系统的交互记录可能被人工审阅,或被用于模型训练,从而引发数据泄露风险。这一举措凸显了大型语言模型在商业应用中的潜在安全隐患。
尽管Voicebox目前仍处于研究阶段,但其展现出的技术实力已引起行业广泛关注。Meta的谨慎决策不仅体现了对AI伦理的重视,也为同类研究项目提供了重要参考。随着语音生成技术的不断进步,如何在创新与安全之间取得平衡,将成为未来AI发展的重要课题。