蚂蚁开源dInfer框架 推理速度飙升10倍引领AI新突破

蚂蚁集团近日宣布正式开源业内首个高性能扩散语言模型推理框架——dInfer,这一创新成果不仅标志着扩散语言模型在推理速度上实现重大突破,更象征着这一前沿技术向实际应用领域迈出了关键性步伐。在最新发布的基准测试中,dInfer的推理性能表现惊人,其速度比英伟达Fast-dLLM框架提升了高达10.7倍,这一数据充分彰显了该框架的卓越性能。

在备受关注的代码生成任务HumanEval中,dInfer单次推理速度达到了每秒1011个Tokens,这一成就开创性地实现了扩散语言模型在开源社区中首次超越传统自回归模型的推理速度记录。这一突破性进展极大地提振了业界对扩散语言模型的信心,使其被视为通往通用人工智能(AGI)的重要技术路径之一。

扩散语言模型的独特优势在于其将文本生成过程创新性地定义为”从随机噪声中逐步恢复完整序列”的去噪过程,这种建模方式赋予了模型高度并行处理能力、全局视野把握以及结构灵活性的显著特点。尽管理论上具备强大潜力,但传统扩散语言模型(dLLM)在实际推理过程中长期受限于三大核心挑战:高昂的计算成本、KV缓存失效问题以及并行解码的技术瓶颈。这些技术难题严重制约了扩散语言模型推理速度的充分发挥,亟待革命性突破。

蚂蚁开源dInfer框架 推理速度飙升10倍引领AI新突破插图1

针对上述挑战,蚂蚁集团研发团队专门设计了dInfer框架,该框架包含四大核心模块:模型接入模块、KV缓存管理器、扩散迭代管理器和解码策略模块。这种模块化设计理念类似于乐高积木的灵活组合方式,既允许开发者根据实际需求自由组合优化各模块,又能在统一平台上实现标准化性能评测。这种创新设计极大地提升了框架的实用性和可扩展性。

在性能测试环节,配备8块NVIDIA H800 GPU的强大计算节点上,dInfer展现出令人震撼的表现。对比测试显示,在保持与Fast-dLLM相当的效果水平下,dInfer的平均推理速度达到了681个Tokens/秒,而Fast-dLLM的速度仅为63.6个Tokens/秒,性能差距高达10.7倍。更值得关注的是,与业界顶尖的推理服务框架vLLM上运行的自回归模型Qwen2.5-3B相比,dInfer的速度优势更为显著,达到了后者的2.5倍。

蚂蚁集团表示,dInfer框架的开放是连接前沿研究与企业应用的重要桥梁,期待全球开发者与研究者能够共同探索扩散语言模型的无限潜能,携手构建更加高效开放的AI生态系统。这一开源举措不仅将推动扩散语言模型技术加速落地,更将为人工智能领域的发展注入新的活力,加速通用人工智能时代的到来。

最新快讯

2025年10月18日

14:39
汽车媒体CarScoops最新报道,美国旧金山近日发生一起针对Waymo自动驾驶出租车的科技恶作剧事件,引发广泛关注。科技爱好者莱利・沃尔兹通过社交媒体平台详细披露了此次事件的经过,称今年7月曾有50名参与者同时通过手机App召唤Waymo自动驾驶出租车,将车辆引至同一条死胡同。他们戏称此举为全球首次对无人车系统的"分布式拒绝服务攻击",试图测试Waymo系...
14:39
2025年10月18日,华为云计算业务迎来重大管理层调整,多名高管因严重违纪问题被严肃问责。此次处分由华为内部纪律监察委员会依据详尽调查结果作出,彰显了公司对合规经营和诚信原则的坚定维护。 据悉,华为云计算BG(业务集团)CEO张平安因云业务存在造假与经济舞弊问题,被处以连降三级处分,其薪资标准调整至新职级上限,并附加严重警告。这一决定体现了公司对高层管理人...
14:39
2025年10月18日,最新创投数据揭示了中国资本市场本周的活跃态势。据财联社创投通统计,上周(10月11日至10月17日)全国共发生90起投融资事件,累计披露金额高达59.15亿元,展现出资本市场对创新项目的持续关注。其中,滴滴自动驾驶以20亿元D轮融资领跑本周,成为最大单笔投资案例,彰显了市场对出行科技领域的热捧。 本周投融资市场呈现多点开花的格局,医疗...
14:26
在人工智能技术的飞速发展浪潮中,抖音 SAIL 团队与新加坡国立大学 LV-NUS Lab 联合研发了一款名为 SAIL-VL2 的创新多模态大模型。这款模型在保持参数规模相对较小的情况下,却能在复杂推理任务中超越众多同类模型,甚至展现出与更大规模的闭源模型相媲美的性能表现。这一突破性成果极大地拓展了小模型的应用边界,为人工智能领域带来了新的可能性。 SAI...
14:07
autoevolution最新报道揭示特斯拉重大调整,新版车主手册确认Model 3和Model Y标准版车型已全面取消传统物理胎压监测(TPMS)传感器。这一创新举措改用基于ABS和ESP系统的间接监测方案,通过精准分析轮速传感器数据来识别胎压异常。具体而言,当胎压不足导致轮胎直径变化时,系统会通过轮速差异自动触发警报,从而实现全天候胎压监控。 这一技术革...
14:07
2025年10月18日,天津全运会射击赛场再掀波澜。在备受瞩目的10米气手枪混合团体决赛中,浙江组合胡凯与姚千寻携手缔造历史,以48环的惊人总成绩强势打破该项目现行的世界纪录,并成功摘得金牌。这一成绩不仅超越了此前由47环保持的原世界纪录,更彰显了两位运动员在赛场上无可匹敌的竞技水平。 资格赛中,胡凯与姚千寻便展现出惊人的稳定性,两人配合默契,发挥出色,为决...
14:07
柬埔寨近日采取果断行动,于10月17日晚成功遣返64名涉嫌网络诈骗的韩国公民,其中包括5名女性嫌疑人。这一重要举措由柬埔寨打击网络诈骗委员会牵头组织,充分展现了该国在加强国际执法合作方面的坚定决心和高效执行力。 此次遣返行动是柬埔寨与国际社会共同打击跨国犯罪的重要实践,不仅体现了中韩两国在司法领域的深度合作,也为全球反网络诈骗行动树立了典范。被遣返的嫌疑人目...
13:35
2025年10月18日,备受瞩目的全球财富管理论坛苏河湾大会在上海隆重举行。在此次盛会中,苹果公司首席执行官蒂姆·库克发表了主题演讲,引发了与会嘉宾的广泛关注。库克在讲话中展现了对人工智能发展的独特见解,他明确表示,苹果公司并不担忧AI技术会让计算机具备类人的思考能力,反而更加忧虑的是人类在AI的冲击下,可能会逐渐丧失应有的温度,变得像机器一样冷漠、缺乏创新...
13:35
2025年10月18日至19日,备受瞩目的全球财富管理论坛·上海苏河湾大会在上海展览中心隆重举行。这场汇聚全球金融智慧的高端盛会不仅探讨了财富管理的未来趋势,更见证了一个里程碑式的时刻——"上海AI-FI实验室"正式揭牌成立。该实验室由静安区政府主导布局,联合多家行业领军企业共同打造,将致力于推动人工智能技术与金融行业的深度融合创新。实验室将重点聚焦机器学习...
13:35
清华大学今日发布讣告,深切缅怀世界著名物理学家、诺贝尔物理学奖得主杨振宁先生。这位科学巨匠因病医治无效,于2025年10月18日在北京逝世,享年103岁。作为20世纪最具影响力的物理学家之一,杨振宁先生以其卓越的学术成就为现代物理学发展奠定了坚实基础。 杨振宁先生在理论物理领域做出了里程碑式的贡献。他提出的"杨-米尔斯规范场论"成为粒子物理标准模型的基石,这...
13:35
任天堂Switch 2自发售以来仅短短五个月,其独占游戏阵容已迅速扩充至22款,这一数字不仅超越了索尼PlayStation 5近五年来积累的18款独占作品,更彰显了任天堂在内容战略上的卓越成效。值得注意的是,尽管统计中包含部分高清复刻作品,但核心原创游戏的丰富度依然令人瞩目,进一步印证了任天堂对第一方内容的坚定投入。从《马力欧赛车:世界》的全球热销,到《塞...
13:35
近期有用户报告在苹果iOS 26.0.1系统中使用Apple Music播放《孤勇者》时出现严重技术故障。具体表现为当播放进度达到3分04秒至40秒区间时,应用会发生闪退现象,导致音乐播放突然中断。经过技术测试发现,该问题具有选择性发作特征——部分设备在播放相同片段时能够正常运行,但歌词显示功能却普遍存在明显错误。特别是"以最卑微的梦"这段关键歌词,系统将其...