OpenAI发布全新智能体编程模型，可长时间运行

日前，OpenAI 方面发布新一代智能体编程模型 GPT-5.1-Codex-Max，并表示其 " 专为长时间、精细化的工作而构建 "。据了解，该模型在长远推理、工作效率及实时交互能力上，均实现了显著提升。

值得一提的是，GPT-5.1-Codex-Max 的核心亮点之一在于首次引入 " 压缩 "（Compaction）机制进行原生训练。据悉，该机制允许模型在接近其上下文窗口限制时，智能地保留关键上下文信息并丢弃无关细节，从而实现跨越数百万 token 的连续工作而不会出现性能下降。

依托这一机制，GPT-5.1-Codex-Max 在 OpenAI 内部测试中成功完成了持续超过 24 小时的复杂任务，其中包括多步骤代码重构和自主调试，同时 token 效率提升约 30%，有效降低了开发成本与响应延迟。对此 OpenAI 方面表示，" 能够长时间持续高效地完成任务是构建更通用、更可靠的 AI 系统的基础能力 "。

OpenAI 方面公布的相关信息显示，GPT-5.1-Codex-Max 在多项关键编程基准测试中表现亮眼。例如在衡量解决实际软件问题的 SWE-Bench Verified 测试中，GPT-5.1-Codex-Max 以 77.9% 的准确率小幅领先于 Gemini 3 Pro 的 76.2%，在 Terminal-Bench 2.0 测试中以 58.1% 的准确率优于 Gemini 3 Pro 的 54.2%。

据了解，目前 GPT-5.1-Codex-Max 已集成到 OpenAI 旗下多个 Codex 开发环境，并涵盖官方命令行工具（Codex CLI）、内部代码审查工具及各类交互式编程环境。同时 OpenAI 方面透露，" 我们计划很快在 API 中提供 GPT ‑ 5.1-Codex-Max"。

自即日起，GPT-5.1-Codex-Max 还将取代 GPT-5.1-Codex，成为 Codex 界面中的默认模型。对此 OpenAI 方面强调，" 与通用模型 GPT-5.1 不同，我们建议仅在 Codex 或类似 Codex 的环境中，将 GPT-5.1-Codex-Max 和 Codex 系列模型用于智能体编码任务 "。

据 OpenAI 方面透露，其内部 95% 的工程师每周都会使用 Codex 系列工具，并且自采用以来，工程师平均拉取请求（Pull Requests）提交量提升约 70%，开发效率显著提高。

【本文图片来自网络】

宙世代

一起剪

相关标签