AI Agent 目前仍难胜任自由职业任务-低调大师

AI Agent 目前仍难胜任自由职业任务

2025-11-05 135

最新基准研究显示，即便是当前最先进的 AI 智能体（AI Agents），在真实世界的自由职业任务中表现依旧乏力，成功率不足 3%。

https://arxiv.org/abs/2510.26787

此研究由 Scale AI 与 Center for AI Safety（CAIS）联合发起，该团队构建了一个名为 “Remote Labor Index”（远程劳动指数，RLI）的基准，用以衡量 AI Agent 在真实、可付费的远程/自由职业任务上的能力。样本任务包括：从自由职业平台（如 Upwork）获取真实任务，涵盖数据抓取、图形设计、视频编辑、游戏开发、行政协作等多种类型。

在这些任务里，最强的 AI Agent 在所有任务中，可成功完成的只占极少数，且产生的“收入”（如果按人力计费）远低于人类。

研究指出，AI Agent 普遍难以胜任需要多步骤流程、多工具协作、与不明确需求沟通的任务。同时，AI Agent 缺乏持续记忆与长期项目积累能力，导致在真实自由职业环境中难以像人类那样不断迭代与自我修正。

虽然 AI Agent 在某些特定、结构化任务上表现不错，但距离完全替代远程工作者或自由职业者仍有相当距离。研究团队也表示，短期内企业更适合将 AI 用于流程辅助，而非完全自主执行复杂工作。

整体来看，这一结果为当前市场的 AI Agent 热潮提供了更现实的参考：技术正在快速进步，但在复杂真实任务中的可用性仍有限，人类的沟通、判断与跨工具整合能力仍然不可替代。

微信关注我们

原文链接：https://www.oschina.net/news/381777

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 曾在解雇奥特曼后讨论与 Anthropic 合并

随着马斯克对OpenAI首席执行官山姆·奥特曼（Sam Altman）的诉讼持续推进，一场震惊全球科技界的“宫斗”内幕正被逐步揭开。据最新公布的法庭文件显示，在两年前萨姆·奥特曼短暂卸任OpenAI首席执行官后不久，该公司曾与人工智能竞争对手Anthropic探讨了合并的可能性。这是马斯克与奥特曼及OpenAI正在进行的与公司重组有关的法律斗争的一部分。 OpenAI联合创始人、前首席科学家伊利亚·苏茨克沃在最近的一份证词中详细介绍了这次合并谈判：OpenAI时任董事会曾在罢免奥特曼后的不到24小时内，与主要竞争对手Anthropic进行了接触，商讨合并的可能性。最终，两家公司合并的讨论因Anthropic提出的“实际操作障碍”而短暂搁置。

2025-11-05

153

字节跳动旗下火山引擎团队近日启动了一项高规格招聘，公开寻求“操作算法资深专家（具身智能）”，并开出了每月高达9.5万元至12万元人民币（95K-120K）的待遇。根据招聘信息，该职位的核心职责包括: 主导研发人形具身机器人的操作算法; 参与具身大模型的预训练与部署; 推动算法在硬件上的系统集成与部署。职位对应聘者的要求极高，需具备计算机科学、自动化、人工智能等相关领域的硕士或博士学历。行业分析认为，字节跳动此次通过火山引擎平台重金招募具身智能专家，标志着其正式加入了由特斯拉、OpenAI 等引领的全球人形机器人研发竞赛，并已将该赛道视为未来的战略高地。

2025-11-05

165

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。