通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成

微新创想:通义实验室今日正式发布两款支持“FreeStyle”指令生成的语音大模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。此次发布标志着语音生成技术从依赖预设标签的传统模式,向基于自然语言指令自由控制的新范式转变,实现了“一句话自由生成语音”的深度交互体验。这一突破为语音技术的应用场景打开了全新的大门,使得语音生成更加灵活、高效和富有创造力。

通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成插图1

Fun-CosyVoice3.5在技术架构与功能升级方面表现出色。该模型特别注重多语种复刻与精细化表达,新增了泰语、印尼语等四个语种的支持。通过引入DiffRO与GRPO强化学习技术,Fun-CosyVoice3.5在语音的韵律表现和音质相似度方面有了显著提升。其生僻字读错率从15.2%大幅下降至5.3%,首包延迟也降低了35%,在语音生成的准确性和效率上实现了双重突破。

Fun-AudioGen-VD则专注于声音设计与场景化建模。该模型能够通过指令精确控制语音的性别、情绪以及空间声学效果,从而模拟出从“疯狂反派”到“热闹咖啡馆”等复杂且富有沉浸感的角色与背景音一体化场景。这种高度定制化的语音生成能力,使得Fun-AudioGen-VD在影视、游戏及虚拟角色创作等领域展现出巨大的应用潜力。

通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成插图2

从行业趋势来看,通义实验室的这一发布不仅将语音生成从单纯的转换工具升级为创作工具,还为内容生产提供了更丰富的可能性。这种可描述、可编排的数字表达能力,有助于降低内容创作成本,同时极大拓展了人机交互的语义丰富度。无论是语音合成还是声音设计,用户都可以通过自然语言指令实现更精准、更个性化的语音生成需求。

未来,随着语音大模型技术的不断成熟,其在多个行业的应用将进一步深化。无论是娱乐产业还是人工智能领域,语音生成技术都将成为推动创新的重要力量。通义实验室的这一系列成果,无疑为行业带来了新的发展机遇,也为用户提供了更便捷、高效的语音创作体验。

最新快讯

2026年03月02日

14:33
微新创想:近日,有网友在社交媒体上分享了一组有趣的画面两只喜鹊频繁出现在大熊猫活动区域竟从大熊猫的屁股上薅取毛发用于筑巢这一罕见行为迅速引发网友热议画面中多只大熊猫包括正正七仔等均表现得十分淡定似乎对喜鹊的借毛行为并不在意 据观察喜鹊们选择大熊猫毛发作为巢材很可能是因为大熊猫毛发柔软且保暖性能极佳是筑巢的理想材料而大熊猫们对此似乎并不抗拒依然悠闲地享受着它们...
14:33
微新创想:在雷军看来小米一定要把电池做好这是5年前他们进入汽车领域后给自己立下的规定 在上周专场直播中雷军透露小米汽车安全相关的团队规模已经超过3500人其中专门负责电池研发的专业团队超过220人 自成立以来电池系统相关专利累计提交486篇目前已获批190篇在电池技术这一新能源汽车核心赛道小米的研发投入与专利布局形成了深度联动 这些专利覆盖了本征安全结构安全...
14:33
微新创想:腾讯王者世界多人冒险游戏《王者荣耀世界》宣布正式定档4月 本作目前已在苹果App Store上架 页面显示预计4月30日推出 游戏大小为3.5GB 系统要求为iOS 12.0或更高版本 据了解 《王者荣耀世界》此前已开启多轮内测 测试阶段对硬件性能有明确要求 PC端需要显卡性能达到RTX1060及同档位的A卡及其他独立显卡以上 显存需在5GB以上 ...
14:32
微新创想:OpenAI 在品牌资产布局上再现重磅动作 近期疑似已完成对顶级域名 GPT.com 的收购 进一步强化其在生成式 AI 领域的品牌护城河 据域名追踪机构报告显示 GPT.com 目前已转移至企业级域名注册商 MarkMonitor 进行管理 并启用了 Whois 隐私保护服务 尽管官方尚未公开确认所有权更迭 但该域名目前已正式定向跳转至 Chat...
14:15
微新创想:2026年3月2日,北京自动驾驶企业卡尔动力宣布完成超1亿美元B轮融资,由地平线与高榕创投联合领投。此次融资标志着公司在自动驾驶技术领域获得重要认可,将进一步推动其在智能物流领域的布局。 本轮融资将用于加速干线无人货运规模化落地,打造‘运输机器人+物流操作系统’智能运力网络。这一战略方向不仅有助于提升物流效率,还将降低运输成本,为行业带来深远影响。...
14:15
微新创想:3月2日凌晨,豆瓣豆品商城因后台设置错误,将原定“满200减20”妇女节优惠误设为“满200减200”,用户仅需支付10元运费即可获得价值200元以上的商品。这一错误迅速引发了抢购热潮,大量用户在短时间内下单,导致平台订单量激增。 活动引发抢购潮,迅速登上微博热搜,被网友称为“豆瓣薅羊毛”。许多消费者在不知情的情况下享受了远超预期的折扣,部分用户甚...
14:15
微新创想:近日,具身智能机器人企业普罗宇宙宣布完成数千万人民币天使轮融资。此次融资标志着公司在具身智能领域迈出了重要一步,为后续发展提供了坚实的资金支持。 该公司总部位于中国,专注于工业级通用具身机器人研发与多场景落地。凭借先进的技术理念和创新的产品设计,普罗宇宙在行业内树立了良好的口碑和影响力。 其自研产品“大白”已实现批量交付,采用首创的SDPAA架构,...
14:15
微新创想:2月28日至3月31日,比利时艺术家马克思·平克斯与制作人维多利亚·冈萨雷斯-菲格拉斯联合创作的摄影展《Max Pinckers:视角之间》在上海X-SPACE富士胶片影像空间正式开幕。此次展览展出33幅来自《2020-MMXX》系列的作品,以独特的视觉语言探索摄影的多重可能性。 展览通过并置同一场景的多重影像,打破了传统摄影中“决定性瞬间”的单一...
14:15
微新创想:联想在MWC 2026正式发布ThinkBook Modular AI PC Concept 联想在MWC 2026展会上推出了全新概念产品ThinkBook Modular AI PC Concept,这款设备以模块化设计为核心亮点,重新定义了AI PC的使用方式。该机型由主本体、可更换副屏模块以及键盘模块三部分组成,用户可以根据实际需求灵活组合...
14:02
微新创想:近日随着春节假期的延续西安市民在享受了连续多日的大鱼大肉后纷纷感到油腻不适为了换换口味不少市民选择走出家门到郊外挖野菜以此方式迎接健康新风尚 据报道西安连下两天小雨后天气放晴郊外的苜蓿苗等野菜冒出新芽吸引了众多市民前来采摘在西安的一些郊外草地上可以看到不少大爷大妈带着工具蹲在地上专心致志地掐苜蓿芽场面十分热闹 市民们表示过年期间大鱼大肉吃多了现在更...
14:01
微新创想:2月26日,延边延吉市一家彩票站传出令人振奋的消息,一位顾客意外中得707万元双色球一等奖。当天下午,这位老顾客在店内花费6元,让店主机选了一张双色球彩票。由于与店主关系密切,购彩后他并未带走彩票,而是随手将其留在了店内。这一举动本以为只是普通的疏忽,却意外成为一段佳话的开端。 当晚21点15分,双色球开奖结果正式公布。店主在核对彩票号码时,惊讶地...
14:01
微新创想:3月1日,四川南充发生了一幕温馨感人的场景。一位32岁的男子首次带着女友回家,全家人提前一个月就开始筹备,精心安排了一场隆重的迎接仪式。当天,30多位家人齐聚一堂,拉横幅、放鞭炮、备鲜花礼盒,场面热闹非凡,仪式感十足。 据男子姐姐张女士介绍,家里已经十年没有人结婚了,因此当得知弟弟要带女友回家的消息后,全家人都异常激动。考虑到弟媳是单亲家庭出身,大...