2025年12月2日,全球领先的AI芯片制造商英伟达正式发布了题为《TiDAR:融合自回归与扩散机制的AI解码新范式》的技术白皮书,详细阐述了其创新性AI解码方法TiDAR的核心原理与应用前景。该方法通过巧妙结合自回归模型与扩散模型的各自优势,实现了对GPU计算资源的极致利用,尤其擅长加速大规模文本生成任务。据官方数据显示,在英伟达Qwen系列模型的测试环境中,采用TiDAR技术后,15亿至80亿参数规模的语言模型吞吐量实现了惊人的4.71至5.91倍提升,而模型准确率始终保持在原有水平或呈现微弱上升趋势,充分验证了该技术的性能优势与实用价值。
TiDAR技术的突破性在于其创新的并行处理架构。该系统通过单一Transformer模型同时执行”下一词预测”与并行起草两种任务,在保持高精度的同时大幅提升了计算效率。在具体测试案例中,Qwen系列不同参数规模的模型均表现出卓越性能,其中80亿参数版本更是实现了5.91倍的吞吐量跃升,这一成果标志着AI解码技术迈入了全新的性能时代。值得注意的是,该技术在实际应用中能够有效利用GPU的闲置计算资源,显著降低算力成本,为大规模AI应用提供了极具性价比的解决方案。
在技术实现层面,TiDAR采用了创新的”结构化注意力掩码”机制。该机制将输入序列科学划分为前缀区、验证区与起草区三个功能模块,通过动态调整注意力权重实现不同阶段的任务分配。这种分区设计不仅有效提升了KV缓存的有效利用率,更从根本上解决了传统扩散模型在解码阶段面临的缓存失效难题。通过这种精细化的资源管理策略,TiDAR能够在保持高准确率的前提下,实现解码过程的极致加速。
目前,TiDAR技术已在Qwen系列15亿至80亿参数规模的模型上完成初步验证,展现出强大的适用性。但英伟达团队表示,当前测试仍局限于中小规模模型,尚未进行内核级优化。未来研究将重点探索该技术在百亿级乃至更大规模模型中的表现,并计划进一步优化算法实现,以适应更复杂的实际应用场景。随着AI大模型持续演进,TiDAR技术有望成为推动文本生成领域发展的关键力量,为各行各业带来革命性的智能应用体验。
