
微新创想:原阿里通义千问(Qwen)大模型技术负责人林俊旸在离职数周后于3月26日晚间首次公开发文,深入探讨了大模型技术的未来发展方向。他指出,当前行业正处于从“推理式思维”向“智能体思维(Agentic Thinking)”转变的关键阶段。过去一年,业界普遍关注如何让模型“多想一会儿”,而林俊旸认为,未来的核心在于模型是否能够为了“采取行动”而进行思考,并在与现实世界的互动中不断调整和优化自身的策略。
林俊旸在文章中回顾了千问团队在2025年初的一次重要尝试与教训。当时团队希望构建一个统一的系统,使模型能够根据问题的复杂程度自动调整推理的深度。然而,这一尝试并未达到预期效果。他指出,推理数据与指令数据在分布上的显著差异,导致强行合并后的模型在两个方面都表现不佳:在思考过程中显得冗余且缺乏决断力,而在执行指令时又显得不可靠且成本过高。这一经验为行业提供了重要的工程启示,也促使Qwen后续采取了独立发布Instruct和Thinking版本的策略。
在林俊旸看来,推理链的长度并不能直接衡量模型的智能程度。他强调,盲目追求长逻辑链实际上是在浪费计算资源。他预测,未来的研发重点将不再仅仅是训练模型本身,而是转向训练“模型+环境”的整体智能体系统。这种新的范式将改变我们对模型性能的评估标准,从单纯关注模型能否解决复杂的数学证明,转向评估模型是否能在真实世界约束条件下,通过持续的交互实现有效进展。
这意味着,环境设计、多智能体协作以及评估机制的稳定性,将成为AI研发过程中不可或缺的核心要素。林俊旸的分析不仅为大模型技术的演进提供了新的视角,也为行业内的技术探索指明了方向。
