OpenAI GPT-5.1-Codex-Max重磅发布上下文压缩机制提升SWE-bench准确率至77.9%

2025-11-20 17:12:12 AI动态 2 次阅读

OpenAI 正式发布全新模型 GPT-5.1-Codex-Max，专为应对复杂软件工程项目而设计，能够高效处理长达数十万行的代码上下文，确保生成内容的高度一致性。这一突破性进展得益于模型中创新引入的“compaction”动态压缩机制，该机制能够在任务执行过程中实时优化记忆管理，自动整理并保留关键状态信息，从而显著降低长会话中可能出现的记忆丢失风险，为大规模代码协作提供更可靠的支撑。

性能表现方面，GPT-5.1-Codex-Max 展现出卓越的提升。在权威的 SWE-bench 测试中，准确率从73.7%大幅提升至77.9%，独立贡献软件工程师任务的得分更是跃升至79.9%。同时，模型在资源效率上实现优化，令牌消耗量减少约12%，这意味着在处理复杂任务时能够以更低的成本达成更高的性能目标。此外，在内容安全方面，不安全内容检测指标“illicit”评分从0.860提升至0.920，显示模型在风险识别能力上取得显著进步。尽管如此，OpenAI 始终保持审慎态度，指出网络安全能力尚未达到“高能力”标准，仍需人工复核环节作为最终保障。

随着 Codex-Max 的推出，旧版模型已正式被取代，成为 Codex 系列的默认配置。开发者和企业用户可以通过 ChatGPT Enterprise、API 接口以及 GitHub Copilot 等渠道获取这一强大工具。值得注意的是，OpenAI 保持了灵活的定价策略，每百万输入 token 5美元，输出 token 15美元，批量调用更享有高达50%的折扣优惠，旨在让更多开发者和企业能够负担得起这一先进技术。

展望未来，OpenAI 已规划在2026年第一季度推出 Codex-Max-Enterprise 专用版本。该版本将特别支持私有部署选项，允许企业根据自身需求自定义代码风格规则，为不同行业提供更具针对性的解决方案。这一系列创新不仅彰显了 OpenAI 在自然语言处理领域的持续突破，更展现了其致力于推动软件开发智能化进程的坚定决心。

2025年11月20日

19:51

OpenAI GPT-5.1-Codex-Max重磅发布上下文压缩机制提升SWE-bench准确率至77.9%

最新快讯

2025年11月20日

德国汽车业就业跌至14年最低裁员潮冲击供应链

飞牛fnOS 1.0正式发布国产NAS系统迎来稳定发展新时代

默沙东公布口服PCSK9抑制剂III期试验结果 enlicitide展现降脂新希望

迅捷兴转让PCB资产增资子公司捷兴智造注册资本将增至5000万元

深科技深圳合肥封测满产扩产持续领跑高端存储芯片市场

夸克AI眼镜携手高德升级出行体验接入扫街榜打车等新功能

戴纳科技获B轮领投 AI黑灯实验室加速科研数字化升级

莱克电气拟2.35亿转让金莱克精密机械90%股权聚焦主业发展

澄天伟业小批量液冷产品成功交付推动AI算力平台合作

真我UI 7.0不限量内测明日启动多款机型参与尝鲜

唯品会Q3交易额431亿超预期增长稳健超预期

杨元庆：AI市场前景广阔不会泡沫化

OpenAI GPT-5.1-Codex-Max重磅发布 上下文压缩机制提升SWE-bench准确率至77.9%

最新快讯

2025年11月20日

OpenAI GPT-5.1-Codex-Max重磅发布上下文压缩机制提升SWE-bench准确率至77.9%