英伟达PersonaPlex-7B-v1：实现全双工实时语音交互的AI黑科技

2026-01-19 12:08:17 AI动态 2 次阅读

英伟达研究团队近日重磅发布了全新一代全双工语音对语音对话模型——PersonaPlex-7B-v1，这款创新模型彻底颠覆了传统AI语音助手“听一句、回一句”的机械式交互模式，致力于打造高度接近人类的自然对话体验。与以往需要通过ASR（语音转文本）、LLM（大语言模型）、TTS（文本转语音）等多重环节串联的复杂架构不同，PersonaPlex-7B-v1采用革命性的单一Transformer架构，实现了语音理解与生成的端到端一体化处理。这种创新设计不仅大幅降低了系统响应延迟，更赋予了AI处理自然语言中断、语音重叠以及实时反馈的卓越能力。正如真人对话般流畅，AI能够在自我表达的同时持续倾听用户指令，即便遭遇突然打断也能迅速调整应对策略，展现出惊人的交互灵活性。

在个性化控制方面，该模型同样表现出色。通过“语音+文本”的双重引导机制，用户不仅可以自由定义AI的角色背景设定，还能精确调整其音色特质与语调风格。据AIbase独家获悉，英伟达在模型训练过程中巧妙融合了海量真实通话数据与精心设计的合成场景，使模型既具备地道的语言表达习惯，又能严格遵循特定行业的专业规范。权威评估数据显示，PersonaPlex-7B-v1在对话流畅度与任务完成效率两项关键指标上，均显著超越了市面上多数开源及闭源对话系统。更多技术细节请参考官方研究发布：https://research.nvidia.com/labs/adlr/personaplex/

划重点：🎙️ 全双工交互突破：PersonaPlex-7B-v1支持实时语音流动态处理，用户可在AI发言过程中随时插话或实现语音重叠，系统将做出即时响应，彻底打破传统对话的僵化限制。🧠 单一模型架构创新：摒弃传统插件式管道设计，采用高效Transformer结构同步预测文本与语音标记，从底层架构显著提升对话的自然性与连贯性。🎭 深度个性化定制：支持长达200token的系统提示词输入及专属语音嵌入技术，用户可灵活塑造AI的角色性格、专业领域知识储备以及情感化音色表达，实现高度个性化的交互体验。

2026年01月19日

12:56

英伟达PersonaPlex-7B-v1：实现全双工实时语音交互的AI黑科技

最新快讯

2026年01月19日

上海浦东资本公司揭牌注册资本100亿聚焦资产运营市值管理

MiniMax广州新公司注册资本7000万拓展华南AI市场

《镖人：风起大漠》定档2026春节

神舟二十号返回舱成功着陆舱外服延寿创纪录

阿里健康发布AI助手“氢离子” 低幻觉高循证赋能医生群体

曹操出行试点车内遗留物自动报失

华创三同获松禾资本Pre-A轮投资多元纳米材料研发领航

慧感智能获雅瑞资本天使轮投资加速多模态感知技术研发

淘宝直播推0元付定抢年货

SK海力士车用LPDDR5X通过ASIL-D认证支持自动驾驶关键系统

爱诗科技获1420万美元战略投资

动易科技获亿元级天使++轮加码投资 AI人形机器人研发加速