三易生活 11-20
OpenAI发布全新智能体编程模型,可长时间运行
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

日前,OpenAI 方面发布新一代智能体编程模型 GPT-5.1-Codex-Max,并表示其 " 专为长时间、精细化的工作而构建 "。据了解,该模型在长远推理、工作效率及实时交互能力上,均实现了显著提升。

值得一提的是,GPT-5.1-Codex-Max 的核心亮点之一在于首次引入 " 压缩 "(Compaction)机制进行原生训练。据悉,该机制允许模型在接近其上下文窗口限制时,智能地保留关键上下文信息并丢弃无关细节,从而实现跨越数百万 token 的连续工作而不会出现性能下降。

依托这一机制,GPT-5.1-Codex-Max 在 OpenAI 内部测试中成功完成了持续超过 24 小时的复杂任务,其中包括多步骤代码重构和自主调试,同时 token 效率提升约 30%,有效降低了开发成本与响应延迟。对此 OpenAI 方面表示," 能够长时间持续高效地完成任务是构建更通用、更可靠的 AI 系统的基础能力 "。

OpenAI 方面公布的相关信息显示,GPT-5.1-Codex-Max 在多项关键编程基准测试中表现亮眼。例如在衡量解决实际软件问题的 SWE-Bench Verified 测试中,GPT-5.1-Codex-Max 以 77.9% 的准确率小幅领先于 Gemini 3 Pro 的 76.2%,在 Terminal-Bench 2.0 测试中以 58.1% 的准确率优于 Gemini 3 Pro 的 54.2%。

据了解,目前 GPT-5.1-Codex-Max 已集成到 OpenAI 旗下多个 Codex 开发环境,并涵盖官方命令行工具(Codex CLI)、内部代码审查工具及各类交互式编程环境。同时 OpenAI 方面透露," 我们计划很快在 API 中提供 GPT ‑ 5.1-Codex-Max"。

自即日起,GPT-5.1-Codex-Max 还将取代 GPT-5.1-Codex,成为 Codex 界面中的默认模型。对此 OpenAI 方面强调," 与通用模型 GPT-5.1 不同,我们建议仅在 Codex 或类似 Codex 的环境中,将 GPT-5.1-Codex-Max 和 Codex 系列模型用于智能体编码任务 "。

据 OpenAI 方面透露,其内部 95% 的工程师每周都会使用 Codex 系列工具,并且自采用以来,工程师平均拉取请求(Pull Requests)提交量提升约 70%,开发效率显著提高。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 工程师 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论