AI Agent 目前仍难胜任自由职业任务
最新基准研究显示,即便是当前最先进的 AI 智能体(AI Agents),在真实世界的自由职业任务中表现依旧乏力,成功率不足 3%。
https://arxiv.org/abs/2510.26787
此研究由 Scale AI 与 Center for AI Safety(CAIS)联合发起,该团队构建了一个名为 “Remote Labor Index”(远程劳动指数,RLI) 的基准,用以衡量 AI Agent 在真实、可付费的远程/自由职业任务上的能力。样本任务包括:从自由职业平台(如 Upwork)获取真实任务,涵盖数据抓取、图形设计、视频编辑、游戏开发、行政协作等多种类型。
在这些任务里,最强的 AI Agent 在所有任务中,可成功完成的只占极少数,且产生的“收入”(如果按人力计费)远低于人类。
研究指出,AI Agent 普遍难以胜任需要多步骤流程、多工具协作、与不明确需求沟通的任务。同时,AI Agent 缺乏持续记忆与长期项目积累能力,导致在真实自由职业环境中难以像人类那样不断迭代与自我修正。
虽然 AI Agent 在某些特定、结构化任务上表现不错,但距离完全替代远程工作者或自由职业者仍有相当距离。研究团队也表示,短期内企业更适合将 AI 用于流程辅助,而非完全自主执行复杂工作。
整体来看,这一结果为当前市场的 AI Agent 热潮提供了更现实的参考:技术正在快速进步,但在复杂真实任务中的可用性仍有限,人类的沟通、判断与跨工具整合能力仍然不可替代。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
OpenAI 曾在解雇奥特曼后讨论与 Anthropic 合并
随着马斯克对OpenAI首席执行官山姆·奥特曼(Sam Altman)的诉讼持续推进,一场震惊全球科技界的“宫斗”内幕正被逐步揭开。 据最新公布的法庭文件显示,在两年前萨姆·奥特曼短暂卸任OpenAI首席执行官后不久,该公司曾与人工智能竞争对手Anthropic探讨了合并的可能性。这是马斯克与奥特曼及OpenAI正在进行的与公司重组有关的法律斗争的一部分。 OpenAI联合创始人、前首席科学家伊利亚·苏茨克沃在最近的一份证词中详细介绍了这次合并谈判:OpenAI时任董事会曾在罢免奥特曼后的不到24小时内,与主要竞争对手Anthropic进行了接触,商讨合并的可能性。 最终,两家公司合并的讨论因Anthropic提出的“实际操作障碍”而短暂搁置。
-
下一篇
火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道
字节跳动旗下火山引擎团队近日启动了一项高规格招聘,公开寻求“操作算法资深专家(具身智能)”,并开出了每月高达9.5万元至12万元人民币(95K-120K)的待遇。 根据招聘信息,该职位的核心职责包括: 主导研发人形具身机器人的操作算法; 参与具身大模型的预训练与部署; 推动算法在硬件上的系统集成与部署。 职位对应聘者的要求极高,需具备计算机科学、自动化、人工智能等相关领域的硕士或博士学历。 行业分析认为,字节跳动此次通过火山引擎平台重金招募具身智能专家,标志着其正式加入了由特斯拉、OpenAI 等引领的全球人形机器人研发竞赛,并已将该赛道视为未来的战略高地。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Hadoop3单机部署,实现最简伪集群
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主



微信收款码
支付宝收款码