阿里Qwen新模型三秒克隆声音 支持十种语言

近日,阿里巴巴云计算的 Qwen 团队重磅发布了两款创新性人工智能模型,专注于通过文本指令实现声音的生成与克隆。这两款模型不仅代表了语音合成技术的最新突破,更将为我们带来前所未有的声音定制体验。

Qwen3-TTS-VD-Flash 模型是此次发布的亮点之一,它赋予用户前所未有的声音创作自由。用户可以根据自己的需求,对声音的每一个细节进行精准定义,无论是情感表达还是说话节奏,都能通过文字描述实现完美呈现。想象一下,只需输入”一位充满活力的中年男性,拥有洪亮的男中音,以快速语速进行广告解说,音调变化夸张且充满销售魅力”,该模型就能迅速生成符合要求的声音效果。据制造商透露,该模型在性能上已超越OpenAI最新推出的GPT-4o mini-tts API,展现出卓越的技术实力。

另一款引人注目的模型是Qwen3-TTS-VC-Flash,它能够以惊人的效率实现声音克隆。仅需三秒钟的音频样本,该模型就能精准复制目标声音,并支持十种语言的复现。Qwen团队自豪地表示,该模型的错误率低于市面上其他同类产品,如Elevenlabs或MiniMax,证明了其技术的领先地位。不仅如此,这款AI还能处理复杂的文本内容,模仿各种动物声音,甚至从已有录音中提取并转化声音特征。

两款模型均通过阿里巴巴云的API平台向公众开放,用户可以通过这一渠道体验强大的语音合成功能。同时,Hugging Face平台上也提供了模型设计和克隆声音的互动演示,让更多人能够直观感受这些创新技术的魅力。划重点:🌟 新款Qwen模型支持通过文本描述生成和克隆声音;🎤 Qwen3-TTS-VC-Flash可在三秒内复制声音,支持十种语言;🚀 模型表现优于竞争对手,适用于处理复杂文本及声音模仿。这些突破性技术不仅将重新定义语音合成领域,更将为各行各业带来革命性的应用可能。

最新快讯

2025年12月24日

16:01
微新创想12月24日重磅报道,近日一位深圳博主的探店视频意外引爆网络,让16岁的烤鸡少年"小陈"迅速走红。根据第三方数据监测,小陈的账号在近30天内粉丝数量激增超过50万,展现出惊人的网络号召力。在商业变现方面,其账号广告报价更是水涨船高:1-20秒短视频广告报价高达2000元,21-60秒视频广告报价4500元,而60秒以上的视频广告更是达到了5000元。...
16:01
微新创想12月24日重磅消息,备受瞩目的小米17 Ultra即将在明晚揭开神秘面纱。随着Geekbench 6跑分数据的提前曝光,这款旗舰机型搭载的第五代骁龙8至尊版芯片性能表现惊艳,单核跑分高达3559分,多核跑分更是达到10854分,彰显其强大的运算能力。 从跑分数据中我们还能发现,小米17 Ultra依然保留了12GB大内存配置,预计起步版本将延续12...
15:25
金科环境近日宣布一项重要的战略布局,计划以总额8480万元人民币的价格收购唐山艾瑞克环境科技有限公司100%股权。此次交易将通过支付5480万元现金以及价值3000万元的新水岛产品来完成。交易完成后,艾瑞克环境将正式成为金科环境的全资子公司,进一步强化其在环保领域的业务布局。 值得注意的是,本次收购交易并不构成关联交易,也不会触发重大资产重组的相关规定。这一...
15:25
2025年12月24日,深势科技正式宣布成功完成总额高达8亿人民币的C轮融资,这一里程碑事件标志着该公司在人工智能领域的持续突破与快速发展。本轮融资吸引了达晨财智、京国瑞基金、北京市人工智能产业投资基金等多家知名投资机构的鼎力支持,充分展现了市场对深势科技创新实力的高度认可。 作为一家专注于AI for Science领域的科技企业,深势科技将此次融资所得资...
15:25
2024年12月23日,深圳汉诺医疗科技股份有限公司正式宣布其科创板IPO申请获得上海证券交易所受理,保荐机构为业内知名的中信证券。这一里程碑事件标志着汉诺医疗成为国内首家成功获批上市体外膜肺氧合(ECMO)系统的企业,实现了国产ECMO技术领域的"零的突破",具有划时代的意义。 作为体外生命支持关键技术的领军者,汉诺医疗的核心产品Lifemotion® E...
15:25
2025年12月24日,备受瞩目的医疗技术公司Plcoskin正式宣布成功斩获1500万美元A轮融资。这一重要里程碑由中日韩多家顶尖产业资本与专业机构联合领投,其中包括中国弘晖基金、韩国Abijou Group以及日本SBI Investment等知名投资方。Plcoskin作为重建整形与再生皮肤护理领域的创新先锋,其核心产品是基于合成PCL的可吸收支架,专...
15:25
2025年12月24日,中国科学院在海南三亚隆重召开年度工作会议,向外界全面展示了我国三大核心载人潜水器在过去一年的卓越应用成果。据官方数据统计,2025年,“蛟龙”号、“深海勇士”号与“奋斗者”号三大潜水器累计完成314次载人深潜任务,其中“蛟龙”号执行93次下潜,“深海勇士”号完成106次,“奋斗者”号更是创下115次下潜的纪录,充分彰显了我国深海探测技...
15:25
2025年12月24日,联想正式发布了专为创作者与程序员量身打造的ThinkCentre X AIO Aura Edition一体机,为专业人士带来全新的高效创作体验。这款产品凭借27.6英寸QHD高清屏幕,以及独特的16:18长宽比设计,不仅提供了更宽广的视觉空间,更优化了多任务处理时的显示效率。其核心搭载英特尔酷睿Ultra X7处理器,确保了卓越的计算...
15:25
2024年12月,美国知名保险公司Aflac向外界证实,其约2265万名客户数据遭到严重泄露。这场数据安全危机的源头可以追溯到同年6月,当时黑客成功入侵了Aflac的系统,窃取了大量高度敏感的客户信息。这些被盗数据包括客户姓名、社会安全号码、身份证件详情以及健康记录等关键资料,一旦落入不法分子手中,可能引发身份盗窃、医疗欺诈等严重后果。 据Aflac向得克萨...
15:25
东京电力公司正式宣布重启计划 柏崎刈羽核电站6号机组将于2025年1月20日恢复运行 在备受关注的能源政策调整背景下,东京电力公司社长小早川智明于当地时间12月24日公开宣布了重大决定:计划于2025年1月20日正式重启柏崎刈羽核电站6号机组。这一消息标志着日本核能利用迈入新阶段,也预示着福岛核事故后日本核能产业的逐步复苏。 据悉,东京电力公司已同步向日本原...
15:19
随着全球物流供应链对效率的要求日益严苛,传统的人工扫描正在被更智能的视觉技术取代。近日,总部位于旧金山的仓储技术初创公司Kargo宣布成功完成4200万美元的 B 轮融资。本轮融资由 Avenir 领投,Linse Capital、Hearst Ventures 和 Lightbank 跟投,显示出资本市场对 AI 自动化仓储赛道的强劲信心。图源备注:图片由...
15:18
阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具备强大情感感知能力,性能直逼闭源巨头GPT-4o Audio和Gemini2.5Pro。AIbase独家解读:Fun-Audio-Chat并非简单聊天工具,而是真正...