
OpenAI 正式发布全新模型 GPT-5.1-Codex-Max,专为应对复杂软件工程项目而设计,能够高效处理长达数十万行的代码上下文,确保生成内容的高度一致性。这一突破性进展得益于模型中创新引入的“compaction”动态压缩机制,该机制能够在任务执行过程中实时优化记忆管理,自动整理并保留关键状态信息,从而显著降低长会话中可能出现的记忆丢失风险,为大规模代码协作提供更可靠的支撑。

性能表现方面,GPT-5.1-Codex-Max 展现出卓越的提升。在权威的 SWE-bench 测试中,准确率从73.7%大幅提升至77.9%,独立贡献软件工程师任务的得分更是跃升至79.9%。同时,模型在资源效率上实现优化,令牌消耗量减少约12%,这意味着在处理复杂任务时能够以更低的成本达成更高的性能目标。此外,在内容安全方面,不安全内容检测指标“illicit”评分从0.860提升至0.920,显示模型在风险识别能力上取得显著进步。尽管如此,OpenAI 始终保持审慎态度,指出网络安全能力尚未达到“高能力”标准,仍需人工复核环节作为最终保障。
随着 Codex-Max 的推出,旧版模型已正式被取代,成为 Codex 系列的默认配置。开发者和企业用户可以通过 ChatGPT Enterprise、API 接口以及 GitHub Copilot 等渠道获取这一强大工具。值得注意的是,OpenAI 保持了灵活的定价策略,每百万输入 token 5美元,输出 token 15美元,批量调用更享有高达50%的折扣优惠,旨在让更多开发者和企业能够负担得起这一先进技术。

展望未来,OpenAI 已规划在2026年第一季度推出 Codex-Max-Enterprise 专用版本。该版本将特别支持私有部署选项,允许企业根据自身需求自定义代码风格规则,为不同行业提供更具针对性的解决方案。这一系列创新不仅彰显了 OpenAI 在自然语言处理领域的持续突破,更展现了其致力于推动软件开发智能化进程的坚定决心。
