Anthropic 发布最强编程模型 Claude 4
Anthropic 今天凌晨 1 点在首届开发者大会上发布了最新大模型 Claude 4。
Claude 4 包含 Opus 4 和 Sonnet 4 两个版本:
- Opus 4 是全球顶级编程模型,非常擅长处理复杂且超长时间的推理任务,尤其是 Agent 领域非常出色。根据 Rakuten 测试数据显示,通过 Opus 4 打造的编程智能体可以独立稳定连续工作 7 小时,超过了之前 OpenAI 创造的记录。
- Sonnet 4 则是 Sonnet 3.7 的迭代版本,同样在编程领域非常出色,在 SWE-bench 上达到了 72.7%,超过了 OpenAI 最新发布的 Codex-1、o3 等前沿模型。
Claude 4 模型提供两种模式:近乎即时响应和用于深度推理的扩展思考。它们支持工具使用下的扩展思考,能交替进行推理和工具使用(如网页搜索)。它们还支持并行工具使用,指令遵循更精确,并在开发者授权访问本地文件时,显著增强记忆能力,能长时间保持任务连贯性并建立隐性知识。
据介绍,Claude Opus 4 具备并行使用多个工具的能力,擅长更精确地执行用户指令,并且可连续自主工作长达 7 小时,在解决问题的过程中,Opus 4 对捷径和漏洞的依赖也降低了 65%,非常适合用于各类代理服务。
为了鼓励开发者使用 Opus 4,Anthropic 还推出了集成 VS Code 和 JetBrains 的 AI 编程代理 Claude Code。
Anthropic 明确指出,未来优秀的 AI Agent 需要三种能力:「情境智能」「长任务执行能力」「真实协作能力」。
一同跟随 Claude 4 系列发布的还有:工具辅助的延伸思考(测试版)、新增模型能力、新的 API 功能(包括代码执行工具、MCP 连接器、文件 API 和最长可缓存 1 小时的提示缓存功能)。
使用方面,Pro、Max、Team 和 Enterprise 计划用户可使用全部 Claude 4 系列模型及扩展思考,免费用户可使用 Sonnet 4。



