GPT-5.2 长程自动化编程任务中表现优于 Claude Opus 4.5-低调大师

GPT-5.2 长程自动化编程任务中表现优于 Claude Opus 4.5

2026-01-15 107

AI 编程辅助工具 Cursor 近日分享了一项内部测试发现：在处理超长程、自主性的编程任务时，OpenAI 最新的GPT-5.2模型表现出比 Anthropic 的Claude Opus4.5更高的可靠性。

为了验证模型能力，Cursor 团队尝试从零开始构建一个功能完备的Web 浏览器，涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。

实测结果显示，GPT-5.2在这种需要数百万行代码、耗时数周的“长跑式”任务中，能够更精准地遵循复杂指令，并保持极高的专注度，有效避免了长程任务中常见的“目标漂移”问题。相比之下，Claude Opus4.5虽然在许多场景表现出色，但在处理此类极大规模工程时，往往更倾向于中途停止或寻找捷径，提前交出控制权。

目前，Cursor已在其平台上同步上线了GPT-5.2模型，旨在探索 AI 代理是否能独立完成通常需要人类团队花费数月才能完成的大型项目。除了浏览器实验，该模型还成功完成了包括 Windows7模拟器及超百万行代码的复杂迁移任务，展现了生成式 AI 在自主工程领域的巨大潜力。

微信关注我们

原文链接：https://www.oschina.net/news/396859

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阶跃星辰开源语音模型 Step-Audio-R1.1，拿下全球第一

阶跃星辰宣布旗下语音模型 Step-Audio-R1.1 在大模型评测榜单 Artificial Analysis Speech Reasoning 中登顶全球榜首。阶跃星辰介绍称，该榜单是目前业界评估“原生语音模型”（Native Audio Models）最权威的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的能力，主要考察维度包括准确率、首包延迟等。和大语言模型同理，语音模型同样需要具备强大推理能力，才能提供更高阶智能、更自然交互。 Step-Audio-R1.1 以 96.4% 准确率，超越 Grok、Gemini、GPT-Realtime 等主流一线模型，刷新历史最好成绩。在性能与速度的综合权衡上，Step-Audio-R1.1 全面碾压同类语音模型。 Step-Audio-R1 是由阶跃星辰发布的全球首个开源原生语音推理模型。它可以在不增加额外时延的情况下，端到端理解语音内容，“像人类一样听到对话即可思考”。核心能力包括：深度语音推理实时响应能力音频领域的可扩展 CoT Step-Audio-R1.1 是最新升级版本，兼顾更强实时对话和复杂语音推理能力...

2026-01-15

106

苹果旗下体积最小的台式电脑 Mac mini 自 2005 年由史蒂夫·乔布斯首次发布以来，已经走过了 21 年历史，从当初为吸引 Windows 用户而生的“最便宜 Mac”，一路在被冷落与复活之间摇摆，如今凭借搭载 M4 芯片的新版，再次成为苹果台式机阵容中的明星产品。 2005 年 1 月 10 日，乔布斯在发布会上展示了首代 Mac mini，这款不附带显示器、键盘和鼠标的“BYODKM”（自备显示器、键盘和鼠标）主机，起售价 499 美元，是当时苹果历史上售价最低的 Mac，目标直指希望用现有外设“低成本转投 Mac 阵营”的 Windows 用户。尽管其小巧机身和“接上就能用”的定位赢得媒体好评，但一旦在硬盘和内存等方面超出基础配置进行升级，价格迅速飙升，也引发用户对“便宜只是表象”的质疑。在硬件与定位上，Mac mini 多次经历重大转折。2006 年，苹果为其换上英特尔处理器，并顺势推出面向企业用户的服务器版本，迎合越来越多将 Mac mini 用作服务器托管业务的公司需求。2010 年，苹果带来铝合金一体成型机身的大改款，新机身更薄更小，但起售价已升至 699 美...

2026-01-15

109

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。