BU-30B-A3B-Preview 发布,1 美元跑 200 个浏览器任务
知名开源浏览器自动化项目 BrowserUse 发布了其首个自研大语言模型——BU-30B-A3B-Preview。 BU-30B-A3B-Preview采用混合专家(MoE)架构,总参数规模达30B(300亿),但实际推理时仅激活3B(30亿)参数。这使得模型在保持顶级智能水平的同时,资源消耗大幅降低,仅需单张消费级GPU即可流畅运行。 该模型基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct进行深度微调,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度高达32K tokens,能够轻松处理复杂长网页内容。 BU-30B-A3B-Preview在浏览器操作任务中表现出色,具备全面的网页交互功能,包括精准元素定位、点击、滚动、表单填写等。其突出的DOM(文档对象模型)理解能力和视觉推理能力,让AI代理能像人类一样“看懂”页面布局和截图,实现高度可靠的自动化执行。 官方强调,该模型特别适合构建Web Agent应用场景,如自动化测试、数据采集、RPA流程等,已在内部基准测试中达到业内领先水平。 官方发布的对比数据显示,BU-30B-A3B-Previe...
