首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/381771

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Anthropic 实践基于 MCP 的代码执行模式,大幅提升 AI Agent 效率

Anthropic 近日介绍了其在 Model Context Protocol(MCP) 上的新实践——通过“代码执行(code execution)”方式,让 AI Agent 以更高效率调用外部工具与数据服务。 随着 AI Agent 需要连接数百甚至上千个工具,传统做法会把所有工具定义与中间结果塞进模型上下文,导致 token 消耗巨大、响应延迟增加、甚至出现上下文溢出。Anthropic 指出,这是当前大规模 Agent 系统的主要性能瓶颈。 新的方案将 MCP 工具暴露为“代码 API”,让 Agent 通过生成并执行代码来调用工具。工具定义在用到时才动态加载,而中间数据处理也在执行环境中完成,仅返回最终结果给模型。这不仅减少模型需要处理的数据量,也让逻辑控制、循环、过滤等工作在代码层面高效完成。 这里以“过滤大规模数据”作为示例:如果从 Google Sheet 拉取 10,000 行数据,先通过代码做筛选、只把少量结果传回模型,而非把所有 10,000 行数据都塞入上下文。 官方测试显示,这种模式能将上下文占用从约 15 万 tokens 降至约 2 千 tokens,...

AI Agent 目前仍难胜任自由职业任务

最新基准研究显示,即便是当前最先进的 AI 智能体(AI Agents),在真实世界的自由职业任务中表现依旧乏力,成功率不足 3%。 https://arxiv.org/abs/2510.26787 此研究由 Scale AI 与 Center for AI Safety(CAIS)联合发起,该团队构建了一个名为 “Remote Labor Index”(远程劳动指数,RLI) 的基准,用以衡量 AI Agent 在真实、可付费的远程/自由职业任务上的能力。样本任务包括:从自由职业平台(如 Upwork)获取真实任务,涵盖数据抓取、图形设计、视频编辑、游戏开发、行政协作等多种类型。 在这些任务里,最强的 AI Agent 在所有任务中,可成功完成的只占极少数,且产生的“收入”(如果按人力计费)远低于人类。 研究指出,AI Agent 普遍难以胜任需要多步骤流程、多工具协作、与不明确需求沟通的任务。同时,AI Agent 缺乏持续记忆与长期项目积累能力,导致在真实自由职业环境中难以像人类那样不断迭代与自我修正。 虽然 AI Agent 在某些特定、结构化任务上表现不错,但距离完全替代远程...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册