Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出

前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab近日宣布一项革命性技术突破,成功攻克了困扰AI行业多年的模型输出不确定性难题。这份重磅研究成果在最新发布的研究报告中详细阐述,该实验室实现了大语言模型推理过程的完全确定性输出。

《在LLM推理中战胜不确定性》的研究报告揭示,即使在温度参数设为0的极端条件下,传统大语言模型仍会对相同输入产生截然不同的输出。研究团队通过深入分析,精准定位了导致这一现象的两大技术根源,并提出了创新性的解决方案。

Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出插图1

研究发现,造成输出不确定性的第一个关键因素是浮点数加法的非结合性问题。在GPU并行计算环境中,(a + b) + c与a + (b + c)的计算结果可能存在微小差异,这些差异在复杂的神经网络中会逐层累积放大。更为核心的发现是,并行计算策略的动态变化才是导致输出不确定性的根本原因。不同的批量大小、序列长度以及KV缓存状态会改变GPU内核的选择策略,进而影响计算执行顺序,最终导致输出结果的差异。

针对这一技术挑战,Thinking Machines Lab创新性地提出了batch-invariant解决方案。该方案要求所有关键计算核在处理不同批量大小或序列分割时,必须保持完全一致的计算顺序和结果。研究团队还针对RMSNorm、矩阵乘法和注意力机制等核心计算模块,提供了具体的优化方法指南。

为验证技术方案的有效性,研究团队选用拥有2350亿参数的Qwen3-235B-A22B-Instruct-2507模型进行严格实验。经过1000次重复测试,该模型在相同输入条件下实现了100%的输出一致性,这一成就在大语言模型发展史上尚属首次突破。

Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出插图2

业界专家普遍认为,这一技术突破对企业级AI应用具有里程碑式的意义。金融风控、医疗诊断、法律文书审核等对准确性和一致性要求极高的应用场景将直接受益于这项技术进步。Thinking Machines Lab此次选择以开放研究的形式发布成果,为全球AI开发者提供了宝贵的技术参考方向。该研究不仅解决了模型输出的可预测性问题,更为AI系统从实验工具向生产工具的转型奠定了坚实的技术基础。

据了解,Thinking Machines Lab成立于2023年,专注于AI基础技术研究。该实验室此前已获得20亿美元种子轮融资,并计划在未来几个月推出首款产品。这项技术突破标志着AI行业正从追求模型规模转向追求应用质量的发展新阶段。随着确定性输出技术的推广应用,AI系统的可靠性和实用性有望获得显著提升。

官方研究报告:https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

最新快讯

2026年03月05日

18:30
微新创想:2026年3月5日,TÜV莱茵北美洲正式完成对咨询与培训机构Quality Support Group Inc.(QSG)的整合。此次整合在北美地区实施,由TÜV莱茵主导,旨在强化其在该区域的业务布局。 此次整合标志着TÜV莱茵在北美市场迈出了重要的一步。通过将QSG纳入旗下,TÜV莱茵不仅扩大了其服务网络,还增强了在专业领域内的技术实力和行业影响...
18:30
微新创想:2026年3月,爱立信在巴塞罗那举行的MWC世界移动通信大会期间,凭借“意图感知切片(ARRP)”技术荣获GTI年度大奖——移动技术创新突破奖。这项技术代表了5G网络智能化发展的重要一步,其核心在于实现无线资源的自动划分。ARRP通过先进的算法和智能分析,能够实时感知用户需求并动态调整网络资源分配。 微新创想:ARRP具备四大显著特性,包括动态频谱...
18:30
微新创想:3月5日,杭州瓴通智能科技有限公司在浙江杭州正式注册成立,注册资本为1000万元,法定代表人是林鸣晖。公司由阿里巴巴旗下的北京锐讯灵通科技有限公司全资持有,标志着阿里巴巴在智能科技与基础软件领域的布局进一步深化。此次成立的新公司专注于软件开发与销售,同时也涉及计算机软硬件及外围设备的制造业务。通过这一举措,阿里巴巴不仅增强了其在人工智能底层技术方面...
18:30
微新创想:2026年3月5日,万马股份(SZ002276)发布公告,宣布拟筹划发行境外股份(H股)并在香港联交所上市。这一重大举措标志着公司国际化战略迈出了实质性步伐,将进一步拓宽融资渠道,优化资本结构,提升国际品牌影响力,并为海外业务拓展提供有力支持。 目前,公司正在与相关中介机构就具体方案进行深入探讨,相关细节尚未最终确定。值得注意的是,此次境外上市不会...
18:30
微新创想:2026年3月,西班牙巴塞罗那举行的世界移动通信大会(MWC)期间,智元机器人携搭载移远通信5G、Wi-Fi等模组的灵犀X2半尺寸人形机器人亮相移远展台。该机器人不仅具备多语种交互功能,还能够进行太极与舞蹈表演,充分展现了人工智能与机器人技术的创新融合。 移远通信提供的模组及天线方案已经通过全球多项认证,能够确保机器人在不同地区稳定运行。这些模组支...
18:30
微新创想:3月5日,阿里巴巴CEO吴泳铭通过内部邮件回应通义千问核心负责人林俊旸离职事件。林俊旸于3月4日在社交平台宣布卸任,其曾为阿里最年轻的P10级技术高管,主导构建Qwen全系列开源大模型。 吴泳铭表示,阿里将持续加大AI研发投入,坚持开源模型策略,并成立由其本人、阿里云CTO周靖人及饿了么董事长范禹牵头的基础模型支持小组,统筹资源强化基础模型建设。 ...
18:30
微新创想:3月5日,均胜电子与恩力动力宣布达成战略合作,共同开拓具身智能机器人动力能源市场。双方将整合电池管理系统(BMS)、固态电池及具身智能技术优势,在产品协同、技术融合与市场共建等方面深度合作,提供“电芯+BMS+数据服务”一体化能源解决方案。 此次合作旨在应对人形机器人对高能量密度、高安全性、轻量化电池的迫切需求。随着具身智能机器人技术的快速发展,市...
18:30
微新创想:2026年3月5日,PingPong以3760万元竞得信航支付剩余49%股权,实现100%控股 此次交易标志着PingPong在跨境支付领域的重要布局 信航支付持有多项支付牌照,业务覆盖全国互联网支付、浙江预付卡发行与受理、跨境外汇及跨境人民币支付 通过收购信航支付,PingPong能够进一步优化业务结构,提升整体运营效率 交易已完成竞价程序,后续...
18:30
微新创想:英伟达近期宣布将复产GeForce RTX 3060显卡 该产品预计将在2026年3月10日至20日期间陆续抵达各大品牌销售渠道 此次复产的GeForce RTX 3060显卡采用128-bit位宽设计 配备8GB显存版本 性能相比之前推出的12GB显存版本有所下降 厂商表示将在产品到货后正式开始销售 这一举措主要是为了增加入门级游戏显卡的市场供应...
18:30
微新创想:2026年3月5日,小鹏汇天在广州黄埔区量产工厂实现5台“陆地航母”飞行器同日下线并完成多机试飞。这一里程碑事件不仅展示了飞行汽车制造的技术突破,也标志着小鹏汇天在智能出行领域迈出了坚实一步。 该工厂作为全球首个飞行汽车现代化流水线量产基地,具备高度自动化的生产能力。在满产状态下,每30分钟即可下线一台飞行器,大幅提升了生产效率和产品交付能力。这一...
18:30
微新创想:2025年10月起,我国自主研发的CR450动车组在沪渝蓉高铁开展运用考核,目标完成60万公里模拟载客运行。截至2026年3月,考核进度已过半,各项试验指标均达标。其单列试验速度达453公里/小时,交会相对速度896公里/小时,噪声、能耗达优级,空气阻力降低超20%,整车减重约50吨。 微新创想:该车型设计适配现有350公里/小时线路,仅需少量基础...
18:30
微新创想:2026年3月,路虎在英国正式发布了揽胜运动版SV Ultimate Edition特别版车型。这款特别版车型限量发售500台,仅面向英国本土市场,旨在向2015年初代SVR车型致敬。外观方面,该车采用了标志性的Velocity Blue Gloss车漆,展现出独特的视觉效果。内饰则采用了双色温莎真皮材质,营造出豪华而舒适的驾乘环境。 在动力系统方...