近日,人工智能语音合成领域迎来重大突破,Elevenlabs公司正式发布了新一代旗舰模型“Eleven 多语言v2”,该模型实现了对28种语言的全面支持,能够精准识别文本并将其转化为高度逼真的语音输出。与上一代产品相比,新模型在语音真实感方面实现了质的飞跃,无论是通用合成声音还是个性化克隆声音,都能在不同语言中保持一致的音色特征和情感表达。通过官方发布的对比演示视频,用户可以直观感受到新模型在语音清晰度、语调自然度和情感传递等方面的显著提升。
随着“Eleven 多语言v2”的正式上线,Elevenlabs也宣布其测试阶段圆满结束。该公司透露,目前该技术已累计服务超过100万用户,覆盖全球多个行业领域。值得关注的是,Elevenlabs正在酝酿一项创新功能——AI语音共享平台,旨在打破语言和声音的壁垒,让任何人都能轻松创作多语言、多声部的音频内容。这一愿景的实现将彻底改变内容创作生态,为全球用户带来前所未有的表达自由度。
Elevenlabs此次推出的多语言模型,其目标用户群体主要包括媒体机构、游戏开发商、出版企业以及独立创作者等需要高质量语音解决方案的专业人士。目前已有众多知名企业成为Elevenlabs的客户,包括D-ID、Storytel、ScienceCast、TheSoul Publishing、Embark Studios等业界领导者。值得一提的是,Elevenlabs所有核心音频技术均为自主研发,展现了其在人工智能音频领域的深厚技术积累。
在语言支持方面,“Eleven 多语言v2”实现了全面升级,目前支持包括中文、韩语在内的28种语言,具体涵盖中文、韩语、荷兰语、土耳其语、瑞典语、印度尼西亚语、菲律宾语、日语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、斯洛伐克语、克罗地亚语、高级阿拉伯语和泰米尔语。同时,英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语等传统强势语言也持续获得优化支持。这一全面的语言矩阵为全球用户提供了强大的内容本地化工具。
产品官方网址:https://elevenlabs.io/blog/multilingualv2/