Selenium 创始人发布 Vibium,面向 AI Agent 的浏览器自动化架构
Selenium 的创始人近日推出了专为 AI Agent 打造的浏览器自动化基础架构 Vibium。 该项目的核心是一个由 Go 语言编写的单一二进制文件 Clicker。这个核心组件集成了浏览器生命周期管理、WebDriver BiDi 协议代理以及 MCP 服务器功能。 浏览器管理:检测/启动启用双向通信的 Chrome 浏览器 双向代理:一种将命令路由到浏览器的 WebSocket 服务器 MCP 服务器:LLM 代理的标准输入输出接口 自动等待:在交互之前轮询元素 屏幕截图:视口捕获为 PNG 格式 项目架构如下: ┌─────────────────────────────────────────────────────────────┐ │ LLM / Agent │ │ (Claude Code, Codex, Gemini, Local Models) │ └─────────────────────────────────────────────────────────────┘ ▲ │ MCP Protocol (stdio) ▼ ┌──────...