微新创想:2026年2月22日,北京,智谱正式发布GLM-5技术报告,全面公开模型架构与训练方法。该模型旨在推动编程范式从‘Vibe Coding’转向‘Agentic Engineering’。
GLM-5采用了DeepSeek稀疏注意力(DSA)机制,在保持128K上下文能力的同时显著降低推理成本。这一技术突破使得模型在处理复杂任务时更加高效,同时维持了高质量的输出表现。
此外,GLM-5构建了新型异步强化学习基础设施及专用算法,进一步提升了后训练效率与长程交互学习能力。这种创新方法不仅优化了模型的训练流程,还增强了其在实际应用中的适应性和稳定性。
在主流开放基准测试中,GLM-5表现优异,达到了当前最先进的水平。同时,在真实端到端软件工程任务中,它超越了所有开源基线,展现出强大的实用价值和性能优势。
