Deepdub Lightning2.5发布实时语音AI模型引领行业革新

2025-09-16 15:21:29 AI动态 28 次阅读

Deepdub 近期震撼发布其尖端语音 AI 模型——Lightning2.5，这款产品被业界誉为该公司有史以来速度最快、最具扩展性的语音解决方案，专为打造实时生产级语音体验而生。Lightning2.5 在多语言 AI 代理、呼叫中心自动化、实时内容本地化以及个性化媒体和游戏等多元化应用场景中展现出卓越性能，成为行业瞩目的焦点。

Lightning2.5 的研发基于 Deepdub 自主研发的语言和语音基础模型，巧妙融合了人类级别的表达能力和高保真度，支持丰富多样的语言。该模型在实时性能方面实现了基础设施的重大扩展，能够精准保留说话者的身份特征、语调变化及情感细节，为用户带来逼真的生产级语音体验。Deepdub 的首席执行官兼联合创始人 Ofir Krakowski 赞叹道：“Lightning 代表了实时、富有表现力的语音生成技术的一次革命性突破。无论是赋能多语言 AI 代理、构建沉浸式内容平台，还是推动大规模的语音优先自动化，Lightning 都能以客户期望的速度、保真度和质量，将基础语音 AI 成功推向生产应用。”

这款新模型配备了重新设计的推理引擎，性能大幅提升，吞吐量高达2.8倍，并发能力提升5倍，延迟低至200毫秒，比行业标准快了整整半秒。这一突破性进展使得 Lightning 非常适合应用于实时语音交互、动态语音解说以及事件驱动的 AI 流程，尤其适用于自主语音代理、交互系统和大规模语音自动化等多个行业领域。

作为 NVIDIA 初创企业孵化计划的一员，Deepdub 针对多种 NVIDIA GPU（包括 H100、A100、L40S 和 A10G）进行了 Lightning 的深度优化，支持本地和云环境的灵活部署。通过利用 NVIDIA TensorRT-LLM 加速堆栈，Lightning 在企业规模下实现了高吞吐量、低延迟的推理，同时确保了高效的运营成本。NVIDIA 媒体与娱乐副总裁 Richard Kerris 高度评价：“随着组织对结合逼真质量、速度和可扩展性的实时语音 AI 需求日益增长，Deepdub 通过基于 NVIDIA GPU 和 TensorRT-LLM 构建 Lightning2.5，使多语言语音体验具备超低延迟和高并发能力，有力帮助客户在全球范围内交付下一代 AI 代理、沉浸式内容和企业语音应用。”

Deepdub 计划在2025年国际广播会议（IBC）上全面展示 Lightning 的强大功能，届时将进行实时语音本地化、动态内容自动化和可扩展语音管道的现场演示。对技术创新感兴趣的朋友不容错过，可前往 AI 展区，Hall14，Booth14.B53 亲身体验 Lightning 的魅力。

划重点:
🎤 Lightning2.5 是 Deepdub 最新推出的实时语音 AI 模型，拥有惊人的2.8倍吞吐量和5倍并发能力。
🌍 新模型支持多语言应用，广泛适用于 AI 代理、呼叫中心自动化等多个场景。
⚡ Deepdub 将在 IBC2025 展会上进行 Lightning 的现场演示，全方位展示其卓越功能。