小米发布MiMo-V2-TTS语音合成大模型支持多语种方言与情感表达

2026-03-19 10:02:30 互联网 3 次阅读

微新创想
今日小米发布Xiaomi MiMo-V2-TTS
这是小米自研的语音合成大模型
不仅能说、能演，还会唱

该模型基于自研Audio Tokenizer
和多码本语音-文本联合建模架构
经过上亿小时语音数据的大规模预训练
以及多维度强化学习
实现了高度可控的多粒度语音风格控制

MiMo-V2-TTS支持从整体风格定调
到局部情绪表达的精准调节
能够在同一句话内完成语气转折
和情感递变
真实还原人类说话的自然韵律

在唱歌时
也能准确表达音高和节奏
自然且富有表现力

为进一步激发模型在大规模预训练中
积累的高表现力语音生成潜力
小米还引入了多维度强化学习
兼顾稳定性与表现力

模型在预训练阶段
通过大量文本-语音对齐数据
学习了书面语与口语表达之间的映射关系
能够智能识别文本中的各类格式信号
如标点符号、语气词、强调标记等

并将其自动转化为恰当、自然的语音表达
全程无需用户额外标注或手动干预

MiMo-V2-TTS还支持多种方言的自然发音
包括东北话、四川话、河南话、粤语、台湾腔等
可进行角色扮演式的风格化演绎
还能实现高质量的歌声合成

小米表示
MiMo-V2-TTS是其语音技术路线图上的重要里程碑
但绝非终点

在小米的规划中
中英文之外更多语种的覆盖
以及与 MiMo-V2-Omni 多模态理解能力的深度融合
让 Agent不仅能看懂世界、理解世界
更能以富有表现力的人类声音去讲述这个世界

2026年03月24日

06:59

苹果WWDC26在线举行聚焦AI与iOS27更新

微新创想：苹果公司于2026年3月24日宣布2026年全球开发者大会（WWDC26）将于6月9日至13日在线举行主会场设在美国加州库比提诺Apple Park 此次大会面向全球开发者及学生涵盖主题演讲Platforms State of the Union超100场视频讲座及互动实验室为不同层次的开发者提供丰富的学习与交流机会 6月9日当天将在Apple P...

06:59

LG显示量产1Hz LCD笔记本屏戴尔XPS 14/16已搭载创新技术

微新创想：2026年3月，LG显示率先实现支持最低1Hz刷新率的LCD笔记本屏幕量产。这一突破性技术标志着笔记本显示技术迈入了全新的节能阶段。该面板采用“Oxide 1Hz”技术，能够智能识别用户的使用场景。在静态内容如文档阅读或网页浏览时，屏幕会自动降至1Hz刷新率，从而显著降低功耗。而在需要快速响应的动态操作，例如视频播放或游戏时，面板则能瞬时升至最高...

06:59

苹果地图App2026年夏季将上线广告功能拓展服务收入

微新创想：2026年夏季苹果公司将在iPhone等设备的地图App中正式推出广告功能这一举措标志着苹果在服务业务领域迈出了重要一步。通过在地图应用中引入广告功能，苹果希望进一步拓展其服务业务的收入来源，以应对其他业务增长放缓所带来的挑战广告机制的设计与谷歌地图相似，允许零售商根据特定关键词进行竞价投放位置广告。例如，当用户搜索“寿司”时，相关商家可以竞标...

05:54

大和证券上调晶科能源评级至持有目标价7.80元看好技术与全球化布局

微新创想：3月24日，日本大和证券SMBC株式会社宣布将晶科能源（688223.SH）投资评级由“卖出”上调至“持有”，目标价定为7.80元人民币。此次调整基于公司N型TOPCon电池出货量持续增长、海外市场渠道深化及盈利边际改善预期。该机构认为，晶科能源在技术迭代与全球化布局方面已显现竞争优势，短期估值具备修复基础。评级调整即日起生效。

01:36

苹果2026WWDC大会时间公布 6月8日至12日线上开启AI与系统更新新纪元

微新创想：苹果公司于2026年3月24日宣布，年度全球开发者大会（WWDC）定于6月8日至12日在线举行。本届大会将面向全球开发者，聚焦iOS 19、macOS 16、visionOS 3等新一代操作系统更新及AI技术集成。活动全程线上举办，延续近年无线下主会场模式。此举旨在降低参与门槛并扩大开发者覆盖范围。注册通道预计将于4月中旬开放。

01:36

苏宁债务重组未结束网传执行完毕为虚假信息

微新创想：2026年3月22日，苏宁电器集团重整案管理人正式回应，澄清网传“张近东资产清零、千亿债务重组执行完毕”等消息为不实信息。该重整案于2025年1月由南京市中级人民法院裁定受理，涉及债务总额高达2387亿元人民币，目前仍处于执行阶段。根据法院裁定的重整计划，苏宁电器集团及其关联的38家公司全部资产已被纳入信托计划。这意味着相关资产将由专业机构进行管...

00:01

道达尔能源加大美国LNG投资布局应对能源转型与市场需求增长

微新创想：2026年3月23日法国道达尔能源公司首席执行官宣布将加快在美国液化天然气LNG领域的投资布局此举旨在响应全球能源转型趋势及欧美市场对清洁能源需求增长公司计划扩大在美LNG接收站出口设施及配套基础设施的资本支出重点推进已合作项目落地加速投资亦有助于增强其在全球LNG供应链中的竞争力并支持欧洲能源供应多元化战略具体投资规模与时间节点...

00:00

中欧班列应对海运危机成为亚欧供应链关键通道

微新创想：2026年3月23日，受中东局势升级影响，多国船东暂停放舱，海运空运成本飙升、运力紧张。这一变化对全球贸易物流格局带来了显著冲击，促使各国重新评估其运输策略。我国外贸与物流企业加速调整运输路径，部分货物转向替代市场，部分由海运转为陆运。这种灵活的应对方式不仅缓解了运输压力，也提高了整体供应链的稳定性与效率。中欧班列因兼具成本效益与时效稳定性，正...

2026年03月23日

22:53

小米发布MiMo-V2-TTS语音合成大模型支持多语种方言与情感表达

最新快讯

2026年03月24日

苹果WWDC26在线举行聚焦AI与iOS27更新

LG显示量产1Hz LCD笔记本屏戴尔XPS 14/16已搭载创新技术

苹果地图App2026年夏季将上线广告功能拓展服务收入

大和证券上调晶科能源评级至持有目标价7.80元看好技术与全球化布局

苹果2026WWDC大会时间公布 6月8日至12日线上开启AI与系统更新新纪元

苏宁债务重组未结束网传执行完毕为虚假信息

道达尔能源加大美国LNG投资布局应对能源转型与市场需求增长

中欧班列应对海运危机成为亚欧供应链关键通道

2026年03月23日

微信安卓8.0.70测试版上线适配Android 7.0以上优化稳定性

詹姆斯·韦布望远镜发现小红点或为宇宙早期球状星团新线索

微软Xbox3月27日凌晨举办伙伴预览发布会公布多款合作游戏最新情报

AI写歌新趋势程序员20万收入背后的创作革命

小米发布MiMo-V2-TTS语音合成大模型 支持多语种方言与情感表达

最新快讯

2026年03月24日

2026年03月23日

小米发布MiMo-V2-TTS语音合成大模型支持多语种方言与情感表达