2025年12月10日,阿里巴巴通义实验室正式发布革命性语音合成AI模型——Qwen3-TTS,现已全面开放API接口供开发者调用。这款先进的AI语音合成技术不仅支持超过49种多样化音色,更涵盖了从男性到女性、从青少年到老年、不同地域特色乃至虚拟角色(如茉兔、小野杏、沧明子等)的全方位声音模拟。在多语言支持方面,Qwen3-TTS实现了中英日法等10种主流语言的完美覆盖,并特别强化了方言合成能力,能够精准还原粤语、四川话、吴语等9种中国地方方言的独特韵律。
相较于上一代产品,Qwen3-TTS在技术表现上实现了质的飞跃。其语速调节系统更加智能流畅,韵律处理能力显著提升,使得合成语音更接近自然真人发音。通过深度学习算法优化,该模型在情感表达和语气变化上更加细腻生动,官方数据显示其拟人化程度已达到接近真人的水平。这一突破性进展将极大拓展语音合成技术的应用场景,为智能客服、虚拟主播、有声读物等领域带来全新体验。目前,开发者可通过Qwen API平台申请使用权限,开启AI语音合成的无限可能
