蚂蚁开源LLaDA2.0 100B参数扩散语言模型创行业先

在大语言模型技术浪潮的推动下,蚂蚁技术研究院近日重磅发布了LLaDA2.0系列模型,这一创新成果标志着业内首个参数规模突破百亿级别的离散扩散大语言模型(dLLM)的诞生。该系列模型不仅成功突破了传统扩散模型难以实现规模化扩展的技术瓶颈,更在生成质量与推理速度上实现了质的飞跃,为大语言模型领域注入了全新的活力与方向。LLaDA2.0系列精心设计了两种版本:16B(mini)和100B(flash),其中100B版本作为目前规模最大的扩散语言模型,在复杂代码生成和指令执行等高要求任务中展现出无与伦比的性能优势。

蚂蚁集团表示,LLaDA2.0系列的核心突破在于采用了全新的Warmup-Stable-Decay(WSD)预训练策略,这一创新机制实现了自回归(AR)模型知识的无缝继承,有效规避了从零开始训练所带来的高昂成本与时间消耗。从技术细节来看,LLaDA2.0系列充分彰显了并行解码的强大优势,其推理速度高达535tokens/s,较同级别AR模型实现了2.1倍的显著提升。这一卓越性能的取得,主要归功于模型在推理过程中对KV Cache的高效复用以及块级并行解码技术的创新应用。此外,蚂蚁集团在后训练阶段还引入了互补掩码和置信度感知并行训练(CAP)等先进技术,进一步提升了模型的数据处理效率与推理速度。

蚂蚁开源LLaDA2.0 100B参数扩散语言模型创行业先插图1

在多项权威评测维度中,LLaDA2.0系列均表现出色,特别是在结构化生成任务如代码生成领域,其展现出的全局规划能力远超同类模型。在涉及复杂智能体调用和长文本处理的任务中,LLaDA2.0同样表现卓越,充分证明了其在多样化应用场景中的强大适应能力与通用性。蚂蚁集团的此次发布不仅标志着离散扩散技术在理论突破与实践应用上达到了新的里程碑,更向业界展示了扩散模型在超大规模应用场景下的巨大潜力与显著优势。

展望未来,蚂蚁集团将继续深耕扩散模型的研究与开发,计划进一步扩大模型参数规模,深入探索强化学习与思考范式的融合应用,并致力于推动生成式人工智能技术的持续进步与创新。更多详情请访问:https://huggingface.co/collections/inclusionAI/llada-20

最新快讯

2025年12月12日

19:06
2025年12月12日,国家市场监督管理总局正式发布《汽车行业价格行为合规指南(征求意见稿)》,面向社会公开征求意见,旨在规范汽车生产及销售环节的价格行为,构建更加公平透明的市场环境。该指南全面覆盖了汽车行业价格管理的全流程,从定价机制到促销活动,再到售后服务收费,提出了系统性的合规要求,为行业健康发展提供明确指引。 指南的核心内容聚焦于价格行为的规范化管理...
19:06
2025年12月12日,工业和信息化部正式发布《元宇宙产业综合标准化体系建设指南(2026版)》征求意见稿,面向社会各界公开征集意见。这份重要文件明确将元宇宙定义为数字世界与物理世界深度融合的沉浸式互联空间,是推动数字经济与实体经济融合发展的关键形态。随着我国元宇宙产业的迅猛发展,相关关键技术持续融合创新,新产品与新应用在工业制造、医疗健康、智慧教育等领域的...
19:06
卡普空正式宣布,《怪物猎人:荒野》即将在12月16日推出备受期待的第四次免费更新,此次升级的核心目标在于全面提升全平台的稳定性和性能表现,为全球玩家带来更流畅的游戏体验。更新内容涵盖了CPU与GPU的深度优化,通过精准调校显著缩短了游戏处理时间,有效降低了系统负载,同时大幅减少了内存占用,从源头上解决了部分玩家遇到的卡顿问题。 在性能提升方面,官方进行了严格...
19:06
2025年12月12日,备受瞩目的冷加工果汁领军企业Buda Juice正式登陆纽约证券交易所,股票代码定为BUDA,标志着其在健康饮品赛道上的里程碑式突破。作为柑橘类饮品领域的创新者,Buda Juice专注于自有品牌与代工业务,凭借其独创的UltraraFreshTM Juice新品类,将冷加工柠檬基饮料推向市场,引领消费新风尚。公司以清洁标签为核心竞争...
19:06
2025年12月12日,德华安顾人寿保险有限公司传来重大喜讯,其15.45亿元人民币的增资方案已获得国家金融监督管理总局山东监管局的正式批准。此次增资行动彰显了安顾集团及其子公司对德华安顾未来发展的坚定信心,双方将共同出资10.0425亿元,占据公司65%的股权比例。与此同时,山东国投控股亦积极参与,出资5.4075亿元,持有公司35%的股份。这一战略投资不...
19:06
2025年12月12日,国家市场监督管理总局正式对外发布《广告引证内容执法指南(征求意见稿)》,向社会公开征求意见。这一全新指南的出台,标志着我国广告监管体系迎来重要升级,旨在进一步强化《广告法》的落地执行,为规范广告市场秩序提供更明确的操作依据。 该指南的核心目标在于有效遏制当前广告领域存在的突出问题。针对部分企业为追求眼球效应而进行的"行业第一"类虚假宣...
19:06
2025年12月12日,个性化数字礼品平台On Me成功斩获600万美元种子轮融资,这一里程碑事件标志着其在数字化礼品领域的创新探索再获资本市场的认可。本轮融资将专项用于强化其数字化礼品卡服务体系,同时加速推动个性化定制与可持续发展的深度融合。On Me通过革命性的平台模式,致力于将传统礼品卡升级为充满情感温度的个性化体验。用户可以在平台上基于自身兴趣爱好,...
19:06
ROBOT MALL合生汇快闪店于11月30日圆满落幕,为期31天的精彩活动吸引了超过30万游客莅临,日均客流稳定突破1万人次,展现出强大的市场号召力。活动现场精心展示的服务机器人、智能教育机器人等系列产品备受关注,成功促成600余笔销售订单,意向成交金额更是高达900余万元,充分印证了消费者对机器人产品的热烈追捧。 作为北京亦庄机器人公司倾力打造的重点运营...
19:06
2025年12月12日,生物制药公司BlossomHill Therapeutics成功完成总额高达8400万美元的B轮扩展融资,其现有投资者维梧资本等机构积极参投。此次融资进一步巩固了BlossomHill的资本实力,使其累计融资总额达到令人瞩目的2.57亿美元。 作为肿瘤与自身免疫疾病治疗领域的创新先锋,BlossomHill此次募集资金将重点投向两大核...
19:06
2025年12月12日,存储解决方案领军企业至誉正式发布重要公告,针对索尼Alpha 7 V相机用户反映的兼容性问题,特别为2024年1月之前出厂的Essential及Element系列CFexpress Type A存储卡提供全面的固件升级服务。这一举措旨在解决早期产品因固件版本较低,在A7M5相机上可能出现的功能异常或不兼容现象。经过严格的技术测试与验证...
19:06
2025年12月12日,本田汽车正式宣布一项具有里程碑意义的战略举措:将于2027财年率先在日本市场推出搭载尖端AI自动驾驶技术的混动及纯电车型。这一创新成果源于本田与美国领先AI初创企业Helm.ai的深度合作,双方共同研发了一套突破性的自动驾驶系统。该系统具备在复杂城市道路与广阔偏远地区稳定运行的能力,能够实现包括自动转向和加速在内的多项高级驾驶辅助功能...
19:06
2025年12月12日,隆盛科技正式宣布一项重大战略布局,计划斥资3.5亿元人民币,在无锡市滨湖区打造具身智能机器人创新中心项目。这一前瞻性项目将由隆盛科技及其控股子公司隆盛唯睿携手推进,其中公司主体将承担约2亿元人民币的土地购置与基础设施建设投资,而隆盛唯睿则负责约1.5亿元人民币的运营投入。 该项目将深度聚焦具身机器人在工业场景的应用研发与产业化进程...