Vercel 开源 Agent Browser,让大模型直接操控网页
前端开发平台Vercel正式推出Agent Browser——一款专为AI代理设计的浏览器自动化命令行工具(CLI),首次赋予大模型“不仅看得懂网页,还能亲手操作”的能力。 Agent Browser的最大亮点在于极致易用:无需手动安装浏览器驱动或配置复杂依赖,安装即用。 开发者只需通过简单的命令调用,即可让AI代理与真实网页环境交互。工具支持两种运行模式——既可在可视化浏览器中实时调试,便于观察AI行为;也可在后台静默执行批量任务,适用于自动化测试、数据采集或流程机器人等场景。 针对传统浏览器自动化工具(如Playwright)向AI传递信息时上下文冗长、效率低下的痛点,Agent Browser进行了深度优化。其数据结构经过精简,可减少高达93%的无关上下文,仅向AI提供关键DOM信息与可操作元素,大幅提升推理效率与准确性。 同时,工具底层采用Rust语言编写,相比基于Node.js或Python的传统方案,启动更快、资源占用更低、执行更稳定。 Agent Browser 目前已全面兼容Claude Code、Gemini、Cursor、GitHub Copilot、Codex、o...

