法国 AI 公司 H Company 开源 Holo1.5 系列模型
法国 AI 公司 H Company 近日发布并开源了 Holo1.5 系列视觉语言模型,该系列专为 Computer Use (CU) Agent 设计。
新系列在UI元素定位与界面问答任务上全面超越了前代 Holo1,平均准确率提升超过10%,并在Web、桌面、移动跨平台基准测试中刷新了开源模型的纪录。
Holo1.5 基于 Qwen2.5-VL 基座模型,采用高分辨率原生输入(最高支持3840×2160),通过大规模监督微调与在线强化学习(GRPO)两阶段进行训练,融合了开源数据、合成数据与人工标注数据。
该系列提供了三种不同规模的模型,并采用不同的开源许可:
模型规模 开源许可 商业用途
3B Qwen 许可 遵循原许可
7B Apache 2.0 完全开放
72B 仅限学术研究 需单独授权
目前,模型已上线 HuggingFace,提供了开放权重、演示空间与本地推理脚本,支持开发者构建能够操纵真实应用的 CU Agent。H Company 表示,未来数周还将发布基于 Holo 系列的新工具与完整的 Agent 方案。

