OpenAI 最强代码模型 GPT‑5.1‑Codex‑Max 上架 GitHub Copilot
OpenAI 近日正式通过 API 向开发者开放其目前最强大的编程模型 GPT‑5.1‑Codex‑Max,主打长时间运行和“代理式”编码任务,在多项权威基准测试中的成绩明显优于常规版 GPT‑5.1‑Codex。 更具吸引力的是,尽管性能提升明显,这一新模型在 API 中的定价却与 GPT‑5 保持一致,被外界视为一次“高性能不涨价”的策略性升级。 报道指出,GPT‑5.1‑Codex‑Max 通过名为“压缩(compaction)”的技术进行训练,可在超过一百万 tokens 的超长上下文窗口中持续工作,内部测试显示该模型能够稳定执行持续超过 24 小时的任务。 在 SWE‑Bench Verified、SWE‑Lancer IC SWE 和 TerminalBench 2.0 等面向真实软件工程场景的基准测试中,GPT‑5.1‑Codex‑Max 的得分分别提升至 77.9%、79.9% 和 58.1%,相较常规版 GPT‑5.1‑Codex 有明显进步,凸显其在复杂、多步骤开发任务中的优势。 在商用层面,OpenAI 已将 GPT‑5.1‑Codex‑Max 以与 GPT‑5 ...
