蚂蚁开源LLaDA2.0 100B参数扩散语言模型创行业先

在大语言模型技术浪潮的推动下,蚂蚁技术研究院近日重磅发布了LLaDA2.0系列模型,这一创新成果标志着业内首个参数规模突破百亿级别的离散扩散大语言模型(dLLM)的诞生。该系列模型不仅成功突破了传统扩散模型难以实现规模化扩展的技术瓶颈,更在生成质量与推理速度上实现了质的飞跃,为大语言模型领域注入了全新的活力与方向。LLaDA2.0系列精心设计了两种版本:16B(mini)和100B(flash),其中100B版本作为目前规模最大的扩散语言模型,在复杂代码生成和指令执行等高要求任务中展现出无与伦比的性能优势。

蚂蚁集团表示,LLaDA2.0系列的核心突破在于采用了全新的Warmup-Stable-Decay(WSD)预训练策略,这一创新机制实现了自回归(AR)模型知识的无缝继承,有效规避了从零开始训练所带来的高昂成本与时间消耗。从技术细节来看,LLaDA2.0系列充分彰显了并行解码的强大优势,其推理速度高达535tokens/s,较同级别AR模型实现了2.1倍的显著提升。这一卓越性能的取得,主要归功于模型在推理过程中对KV Cache的高效复用以及块级并行解码技术的创新应用。此外,蚂蚁集团在后训练阶段还引入了互补掩码和置信度感知并行训练(CAP)等先进技术,进一步提升了模型的数据处理效率与推理速度。

蚂蚁开源LLaDA2.0 100B参数扩散语言模型创行业先插图1

在多项权威评测维度中,LLaDA2.0系列均表现出色,特别是在结构化生成任务如代码生成领域,其展现出的全局规划能力远超同类模型。在涉及复杂智能体调用和长文本处理的任务中,LLaDA2.0同样表现卓越,充分证明了其在多样化应用场景中的强大适应能力与通用性。蚂蚁集团的此次发布不仅标志着离散扩散技术在理论突破与实践应用上达到了新的里程碑,更向业界展示了扩散模型在超大规模应用场景下的巨大潜力与显著优势。

展望未来,蚂蚁集团将继续深耕扩散模型的研究与开发,计划进一步扩大模型参数规模,深入探索强化学习与思考范式的融合应用,并致力于推动生成式人工智能技术的持续进步与创新。更多详情请访问:https://huggingface.co/collections/inclusionAI/llada-20

最新快讯

2025年12月12日

17:35
日本制铁集团于本周五正式公布其宏伟的产能扩张计划,预计到2030年将实现全球粗钢年产量突破1亿吨大关。作为日本钢铁行业的领军企业,该集团此次宣布的战略升级,不仅彰显了其巩固行业龙头地位的决心,更体现了对全球钢铁市场格局变化的敏锐洞察。 此次产能提升的核心策略包括两大方向:一方面,日本制铁将重点推进现有工厂的智能化改造与技术升级,通过引入最新自动化生产线和节能...
17:35
2025年12月9日,《财富》全球峰会现场,Arm公司首席执行官雷内·哈斯发表了令人瞩目的行业洞察。他明确指出,在未来五年内,具备先进物理人工智能技术的类人机器人将大规模取代传统工厂岗位,进而引发全球制造业的深刻变革。这一预测不仅揭示了技术发展的惊人速度,更预示着产业格局的颠覆性重构。 哈斯特别强调,这类革命性机器人的核心竞争力在于其卓越的环境适应能力。得益...
17:35
2025年12月12日,工业和信息化部办公厅正式发布《民爆行业落实〈国家智能制造标准体系建设指南〉实施方案》,标志着我国民爆行业迈向智能制造新时代的关键一步。该方案立足于智能制造技术的最新发展趋势,同时紧密结合民爆行业的实际应用需求与实践基础,系统性地提出了推进智能制造先进技术在行业典型场景中的深度应用。方案强调遵循“统筹规划,急用先行”的核心原则,确保标准...
17:35
2025年12月12日,中国领先的制药企业力生制药传来振奋人心的消息,其子公司中央药业自主研发的阿普米司特片成功获得国家药品监督管理局(NMPA)的上市许可。这款创新药物专为治疗特定免疫性疾病而设计,主要面向成人患者群体。此次关键性的获批,不仅基于一系列严谨的临床试验所提供的充分数据,有力证实了该药品在安全性及疗效方面的卓越表现,更彰显了中央药业在创新药研发...
17:35
2025年前11个月,中国理财市场迎来蓬勃发展,管理规模超万亿元的14家头部理财公司合计实现资产增长约3.43万亿元,强势推动银行理财总规模突破33万亿元大关,创下历史新高。这一显著增长主要得益于“固收+”类产品的强劲表现,其新增规模高达1.32万亿元,成为市场扩张的核心引擎。值得注意的是,仅2025年第四季度,上述机构规模便新增1.67万亿元,占全年总增量...
17:35
2025年12月,科技巨头英伟达将在美国加州圣克拉拉总部秘密举办一场高规格闭门峰会。这场行业峰会将邀请全球顶尖的科技领袖、能源专家以及数据中心运营商,共同聚焦当前人工智能领域面临的核心挑战——数据中心电力短缺问题。随着AI算力需求的爆炸式增长,全球数据中心的能源供应瓶颈日益凸显,成为制约行业发展的关键瓶颈。此次峰会旨在搭建一个高层次的交流平台,通过跨界合作凝...
17:35
2025年12月12日,国际领先的多元化资产经纪平台格伦FXTRADING.com正式宣布任命Amit Kaushik担任公司首席营销官(CMO)一职。作为全球营销战略的核心负责人,Amit将全面主导公司品牌建设与市场拓展工作,尤其聚焦亚太地区、中东及北非市场、欧洲等三大关键增长区域的品牌影响力提升与数字化创新布局。这一重要任命旨在进一步巩固格伦在新兴市场的...
17:35
12月12日,万达电影正式宣布完成对广州方图科技旗下“拍立方”的战略投资,这一举措标志着两大品牌在影像娱乐领域的深度合作迈入新阶段。据悉,双方将共同探索“影像社交新生活”的消费场景创新,计划在2026年春节前推动拍立方设备全面进驻全国万达影城,为观众带来全新的互动体验。 拍立方自2020年投入运营以来,已迅速扩张至覆盖超160座城市,服务人次累计突破千万大关...
17:35
2025年12月12日,药明巨诺-B(02126)正式宣布,刘敏因个人职业发展规划调整,已正式辞去公司执行董事、主席及行政总裁等所有职务。这一重要人事变动旨在推动公司管理层结构优化,以适应未来战略发展需求。与此同时,公司董事会一致决议,任命刘诚接任董事会主席一职,全面负责公司治理与战略决策。 田丰将于2025年12月29日正式履新,出任公司行政总裁及执行董事...
17:35
2025年12月12日,创新科技企业首形科技(AheadForm)正式宣布成功完成新一轮战略融资。本次融资由中网投与蚂蚁集团联合领投,上海未来产业基金、东方富海等知名投资机构积极跟投,而老股东招商局创投更是持续看好其发展潜力,超额追投。深蓝资本作为独家财务顾问全程参与此次交易。据悉,这笔融资将重点用于三个核心领域:一是拓展产品矩阵,二是构建小批量量产体系,三...
17:35
12月12日,备受瞩目的视频创作团队影视飓风正式官宣入驻阿里国际站,开启全球化布局新篇章。这一重要战略举措不仅彰显了团队对海外市场的信心,更将AI技术深度融入跨境电商运营,为品牌出海注入强劲动力。据官方透露,影视飓风通过阿里国际站平台已成功接洽来自全球30多个国家的客户合作意向,初步订单覆盖欧美、东南亚等多个热门市场,展现出强大的国际市场吸引力。 影视飓风在...
17:35
2025年12月,深圳核心医疗科技股份有限公司成功获得上海证券交易所科创板上市审核委员会的受理,正式开启其资本市场的新征程。作为科创板第五套上市标准重启后的首批获受理企业,核心医疗在创新医疗器械领域树立了新的里程碑。公司成立于2016年,始终专注于医疗器械的研发与创新,其控股股东余顺周先生持有公司29.14%的股份,展现出对核心医疗长期发展的坚定信心。经过数...