Anthropic 发布最强编程模型 Claude 4
Anthropic 今天凌晨 1 点在首届开发者大会上发布了最新大模型 Claude 4。 Claude 4 包含 Opus 4 和 Sonnet 4 两个版本: Opus 4 是全球顶级编程模型,非常擅长处理复杂且超长时间的推理任务,尤其是 Agent 领域非常出色。根据 Rakuten 测试数据显示,通过 Opus 4 打造的编程智能体可以独立稳定连续工作 7 小时,超过了之前 OpenAI 创造的记录。 Sonnet 4 则是 Sonnet 3.7 的迭代版本,同样在编程领域非常出色,在 SWE-bench 上达到了 72.7%,超过了 OpenAI 最新发布的 Codex-1、o3 等前沿模型。 Claude 4 模型提供两种模式:近乎即时响应和用于深度推理的扩展思考。它们支持工具使用下的扩展思考,能交替进行推理和工具使用(如网页搜索)。它们还支持并行工具使用,指令遵循更精确,并在开发者授权访问本地文件时,显著增强记忆能力,能长时间保持任务连贯性并建立隐性知识。 据介绍,Claude Opus 4 具备并行使用多个工具的能力,擅长更精确地执行用户指令,并且可连续自主工作长达 7...
