Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出

前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab近日宣布一项革命性技术突破,成功攻克了困扰AI行业多年的模型输出不确定性难题。这份重磅研究成果在最新发布的研究报告中详细阐述,该实验室实现了大语言模型推理过程的完全确定性输出。

《在LLM推理中战胜不确定性》的研究报告揭示,即使在温度参数设为0的极端条件下,传统大语言模型仍会对相同输入产生截然不同的输出。研究团队通过深入分析,精准定位了导致这一现象的两大技术根源,并提出了创新性的解决方案。

Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出插图1

研究发现,造成输出不确定性的第一个关键因素是浮点数加法的非结合性问题。在GPU并行计算环境中,(a + b) + c与a + (b + c)的计算结果可能存在微小差异,这些差异在复杂的神经网络中会逐层累积放大。更为核心的发现是,并行计算策略的动态变化才是导致输出不确定性的根本原因。不同的批量大小、序列长度以及KV缓存状态会改变GPU内核的选择策略,进而影响计算执行顺序,最终导致输出结果的差异。

针对这一技术挑战,Thinking Machines Lab创新性地提出了batch-invariant解决方案。该方案要求所有关键计算核在处理不同批量大小或序列分割时,必须保持完全一致的计算顺序和结果。研究团队还针对RMSNorm、矩阵乘法和注意力机制等核心计算模块,提供了具体的优化方法指南。

为验证技术方案的有效性,研究团队选用拥有2350亿参数的Qwen3-235B-A22B-Instruct-2507模型进行严格实验。经过1000次重复测试,该模型在相同输入条件下实现了100%的输出一致性,这一成就在大语言模型发展史上尚属首次突破。

Thinking Machines Lab突破AI随机性难题 大模型首次实现100%一致输出插图2

业界专家普遍认为,这一技术突破对企业级AI应用具有里程碑式的意义。金融风控、医疗诊断、法律文书审核等对准确性和一致性要求极高的应用场景将直接受益于这项技术进步。Thinking Machines Lab此次选择以开放研究的形式发布成果,为全球AI开发者提供了宝贵的技术参考方向。该研究不仅解决了模型输出的可预测性问题,更为AI系统从实验工具向生产工具的转型奠定了坚实的技术基础。

据了解,Thinking Machines Lab成立于2023年,专注于AI基础技术研究。该实验室此前已获得20亿美元种子轮融资,并计划在未来几个月推出首款产品。这项技术突破标志着AI行业正从追求模型规模转向追求应用质量的发展新阶段。随着确定性输出技术的推广应用,AI系统的可靠性和实用性有望获得显著提升。

官方研究报告:https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

最新快讯

2026年03月05日

17:23
在生成式AI(AIGC)重塑信息检索范式的今天,传统的SEO(搜索引擎优化)正加速向**GEO(Generative Engine Optimization,生成式引擎优化)**转型。根据2026年最新的行业调研,超过60%的用户已习惯通过AI助手直接获取产品推荐。当潜在客户询问“哪款智能手表适合运动?”或“最好的项目管理工具有...
17:23
声明:本文来自于微信公众号 卡思数据,作者:岳遥,授权站长之家转载发布。小红书“产出”女明星带货标杆的频率似乎正在加快。去年9月21日,演员吴千语在小红书开启直播带货首秀,最终斩获7000万元GMV,超过了董洁、章小蕙2023年的带货首秀成绩,成为小红书新的带货“一姐”。随后,12月7日,她正式开启第二场直播,开播一小时支付金额...
17:23
微新创想3月5日消息,据媒体报道,近日,河北衡水一名女孩学仰泳,直接被晒成了酱油色”。据悉,女孩今年9岁,在泰国曼谷旅游时,连续练习了3天仰泳,结果直接晒这么黑。女孩妈妈介绍,女儿对仰泳特别感兴趣,一连三天都在坚持练习。她本身就是黄黑皮,平时晒太阳就容易黑,没想到这次晒得这么严重。更让人哭笑不得的是,孩子在过海关时甚至被工作人员...
17:23
2026年3月5日,东南亚农业无人机标杆企业Aonic(前身为Poladrone Solutions)宣布完成1000万美元A轮融资,由Kairous Capital领投。该公司总部位于东南亚,聚焦农业与工业场景,以自研无人机硬件、全栈软件及本地化服务生态为核心能力。本轮融资将用于加速产品研发、扩大区域服务网络,并深化在东南亚多国的农用无人机落地应用。Ao...
17:23
2026年3月5日,CORSAIR海盗船正式推出FRAME 5000D WORKSTATION机箱。该产品基于FRAME 5000D设计,专为高性能生产力系统优化。其兼容SSI-EEB规格主板,支持最多四块双槽显卡、2块3.5英寸及6块2.5英寸硬盘。前置接口升级为1个20Gbps与2个10Gbps USB-C,取消前后侧420mm冷排支持。钢制侧板内置降...
17:23
2026年3月5日,自动驾驶公司Momenta已在香港秘密提交首次公开募股(IPO)申请。该公司正与中国国际金融股份有限公司及德意志银行合作推进上市,计划融资不少于10亿美元(约69.06亿元人民币)。此举旨在把握近期港股科技公司上市热潮。Momenta成立于2016年,估值超50亿美元,股东包括通用汽车、梅赛德斯-奔驰、上汽集团、丰田、淡马锡及云锋基金等...
17:23
徕卡即将推出SL系列平价机型SL3-P,实为松下S1 RII贴牌机型,搭载44.3MP背照式全画幅传感器及L2影像技术。该机定于2026年5月上市,售价6000欧元(约合48163元人民币)。虽尚未公布外观设计,但预计采用更圆润造型、皮革饰皮及徕卡标识。其性能继承S1 RII的AI人眼/面部追踪、40fps高速连拍及8K视频能力。产品由徕卡负责品牌与调校,...
17:23
2026年3月5日,AI招聘自动化平台HireBound宣布完成200万美元种子轮融资。本轮融资由Kalaari Capital领投,Antler、Infinyte Club与CareerNet跟投。该公司聚焦招聘执行层,以AI智能代理替代传统ATS记录功能,实现从人才寻访、筛选到推荐的端到端自动化。总部位于印度班加罗尔,团队正加速拓展亚太及北美市场。此次...
17:23
宝马将于2026年3月18日在全球首发全新i3(代号NA0),该车为新世代(Neue Klasse)平台首款轿车,定位iX3的轿车版。新车将于2026年下半年在慕尼黑工厂投产,初期仅推i3 50 xDrive单一款型,搭载双电机四驱、463马力、645牛·米扭矩及108千瓦时电池,支持400千瓦超充。设计上采用全新语言与iDrive X车机系统,标配贯穿式...
17:23
3月5日凌晨,亚马逊对其机器人部门实施岗位裁减,系其持续成本优化计划最新动作。事件发生于美国西雅图总部,由机器人业务副总裁斯科特·德雷瑟通报。裁员规模“相对较少”,具体人数未披露,但公司强调将提供离职补偿、医保及再就业支持。此举旨在精简组织、聚焦AI数据中心等战略领域,2026年资本支出预计达2000亿美元。尽管自2022年末已裁超5.7万人,亚马逊重申机...
17:23
微新创想:3月5日,中国邮政集团浙江省分公司与华数数字电视传媒集团在杭州正式签署战略合作协议。此次合作标志着两家国有企业在数字化转型与融合发展道路上迈出坚实一步。 双方将围绕产业效率提升、民生服务优化、战略价值共创三大方向协同发力。通过深化合作,共同推进数字技术与实体经济的深度融合,赋能物流智能化发展,提升整体运营效率和服务水平。 合作还将聚焦于打通服务渠道...
17:23
微新创想:2026年3月5日,阳狮集团宣布任命Naomi Michael为亚太区首席传播官。她将常驻新加坡,全面负责集团在亚太区各市场及业务线的传播战略,向亚太区CEO林真(Jane Lin-Baden)汇报。 Naomi此前在宏盟媒体担任亚太区品牌营销负责人,积累了丰富的品牌管理与市场推广经验。加入宏盟之前,她曾在IPG盟博担任首席营销与传播官长达九年,期...