Hume AI开源TADA模型:5倍速零幻觉TTS支持700秒长音频生成

微新创想:Hume AI近日开源发布了其最新语音生成模型TADA(Text-Acoustic Dual Alignment)这是一款基于大语言模型的文本转语音TTS系统采用创新的文本声学双对齐架构显著提升了生成效率可靠性及适用场景

据官方介绍TADA通过将文本token与声学表示实现1:1严格同步彻底解决了传统LLM-based TTS系统中常见的token级内容幻觉问题在超过1000个测试样本的评估中该模型实现了零内容幻觉的表现

在性能方面TADA的生成速度比同级别LLM TTS系统快5倍以上同时资源消耗极低每秒音频仅需2-3帧计算资源而传统方案通常需要12.5至75帧这使得模型能够在手机边缘设备等低功耗硬件上实现本地推理无需依赖云端服务器

TADA支持包括中文在内的多种语言多语言版本基于Llama3.23B参数规模并提供1B主要针对英语和3B多语言预训练模型模型采用2048token的上下文窗口能够一次性生成约700秒的连续音频远超传统方案在相同token限制下仅能支持约70秒的水平

另一项重要创新是同步转录功能模型在生成语音的同时直接输出对应文本转录无需额外运行独立的语音识别ASR流程从而实现零额外延迟的文字输出这一特性对于实时字幕语音交互和内容创作等应用具有显著价值

在人类主观评测中TADA的自然度和音色相似度排名位居第二超越了多个参数规模更大训练数据更多的系统展现出极具竞争力的语音质量

最新快讯

2026年03月12日

16:19
微新创想:2026年3月11日,国际研究团队在《天体物理学杂志快报》发表成果,揭示引力波事件GW200105中黑洞与中子星以显著椭圆轨道绕行后合并。这一发现为理解双星系统的演化提供了新的视角。 该事件发生于约9.1亿光年外,产生质量约13倍太阳质量的黑洞。科学家通过分析引力波信号,确认了这一合并过程的特殊性。研究团队利用伯明翰大学开发的新引力波模型,对事件进...
16:19
微新创想:2026年3月,美国机器人企业Mind Robotics宣布启动总额5亿美元的A轮融资,由Accel和a16z联合领投,预计于本月内完成。此次融资将进一步推动公司在工业机器人领域的技术突破与市场拓展。 该公司由Rivian CEO RJ Scaringe创立并领导,Rivian作为其主要股东,不仅提供资金支持,还贡献数据资源与工业场景应用经验。这种...
16:19
微新创想:砺算科技在AWE 2026展会发布LX系列三款专业显卡 砺算科技于3月12日在AWE 2026展会上正式推出LX系列三款专业显卡,标志着其在高性能计算领域迈出了重要一步。此次发布的显卡不仅在性能上有所突破,更在适用场景和用户需求上进行了精准定位。 LX MAX型号配备12GB显存,采用轴流风扇设计,主要面向轻量级应用市场。它能够满足日常办公、基础图...
16:19
微新创想:3月12日,哔哩哔哩电视剧官方账号@迷影社宣布,美剧《黑袍纠察队》第一季即将登陆B站,首播时间尚未公布。该剧由亚马逊出品,聚焦超能力者与普通人共存的世界,讲述沃特集团旗下英雄团队的虚伪本质及普通人休伊的复仇之路。 目前预告播放量超27.8万,1.2万人预约追剧。B站引进旨在丰富反超级英雄题材内容,满足用户对暗黑现实向剧集的需求。 《黑袍纠察队》以其...
16:19
微新创想:3月12日,腾讯旗下AI原生桌面智能体WorkBuddy正式升级。此次更新标志着WorkBuddy在跨平台办公体验上的重要突破。用户现在可以通过手机微信发送指令,实现对电脑的远程操控。这一功能让用户能够更便捷地完成各类工作任务,无论身处何地都能高效处理电脑端事务。 微新创想:此次升级后的WorkBuddy工作台实现了与微信的深度直连。用户只需在微信...
16:19
微新创想:美国东部时间3月11日6:37,NASA范艾伦探测器A在东太平洋(南纬2度、东经255.3度)重返大气层,正式结束运行。该探测器于2012年8月发射,重约600千克,原计划服役2年,实际超期工作至2019年10月。其主要任务是研究地球辐射带,提升空间天气预报能力。 受近年太阳活动增强导致大气膨胀影响,轨道衰减加速,比原预计的2034年提前十余年再入...
16:19
微新创想:3月11日,PingPong在美国旧金山举行的GDC 2026大会上发布游戏出海一站式全球收单解决方案。该方案覆盖超90%美国本地玩家支付场景,面向全球出海游戏厂商。同步首发原生SDK收银台,依托底层API能力,突破传统技术接入限制,功能深度适配游戏内购、多币种结算、合规风控等核心需求。此举旨在提升海外支付转化率与用户体验,助力游戏企业高效拓展北美...
16:19
微新创想:3月12日,中国物流与采购联合会与京东集团联合发布数据显示,2026年2月中国电商物流指数为109.0点,环比下降3.7点。该指数反映当月电商物流整体运行情况,涵盖总业务量、农村业务量、物流时效、履约率、库存周转率、实载率、人员及成本等九项分项指数,全部出现回落。 微新创想:指数虽有所回调,但仍处于100点以上景气区间,表明电商物流仍保持扩张态势。...
16:19
微新创想:2026年3月,宝马匈牙利德布勒森工厂正式启用第二班次生产,较原计划大幅提前。这一举措标志着宝马在欧洲市场的电动化布局进一步提速。 该工厂满负荷年产能达15万辆,目前专产标准轴距版iX3(NA5)。新车已于数日前在欧洲开启交付,标志着宝马在本地化生产与市场响应方面取得重要进展。 今夏将登陆美国,显示出宝马对北美市场的高度重视与战略布局。随着产品在欧...
16:19
微新创想:英伟达(NVIDIA)在AI大模型领域再次投下震撼弹。3月12日,英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型——Nemotron3Super。该模型凭借极高的推理效率和卓越的任务成功率,迅速成为开源社区的焦点。 架构革新:推理速度暴增300% Nemotron3Super采用了创新的 Mamba-MoE 混合架构,参数总量为...
16:19
微新创想:小米今日正式发布移动端Agent交互测试产品「Xiaomi miclaw」标志着其在智能终端自动化交互领域迈出关键一步该产品基于小米自研MiMo大模型构建定位为“类OpenClaw”的AI智能体应用旨在通过大模型深度理解复杂指令并实现环境感知交互作为国内首个落地手机端的类OpenClaw应用Xiaomi miclaw目前采取极高门槛的准入机制首批仅...
16:18
微新创想:江苏镇江有位王女士,三年前在邻村奶奶家邂逅了一棵满树繁花的50岁老梨树,那美景让她久久难忘。这棵老梨树不仅枝繁叶茂,而且花开如雪,仿佛在诉说着岁月的故事。王女士被它的美丽深深打动,心中萌生了将其带回家的念头。 三年后,当种树的奶奶离世,这棵承载着美好回忆的梨树竟面临被砍的命运。王女士得知消息后,毫不犹豫地决定将它移栽到自己7公里外的小院中。她不仅亲...