Hugging Face 发布 ScreenSuite:开源 GUI 智能体评测套件
Hugging Face 开源了专用于评估 GUI 智能体的综合测试套件 ScreenSuite。
什么是 GUI Agent?简单说,就是“能像人一样操作屏幕”的 AI!它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。
现在,Hugging Face 推出了全新的开源工具 ScreenSuite,帮助开发者和研究者评估这类视觉语言模型的实际操作能力!
ScreenSuite 能做什么?
它整合了 13 个评测集,覆盖:
- 屏幕感知与 UI 定位
- 单步操作指令执行
- 多步骤任务规划与完成
ScreenSuite 已在多个主流 VLM 上完成评测,包括:
- Qwen2.5-VL 系列(3B~72B)
- UI-TARS、Holo1 等优秀开源模型
- GPT-4o 等闭源模型
ScreenSuite 支持 Ubuntu、Android、Windows 多平台评测,结合虚拟机环境还原真实交互场景,适用于科研评估与模型迭代。与其他评测不同的是,ScreenSuite 完全基于视觉输入,不依赖 DOM 或辅助树,更贴近人类的使用方式,挑战也更真实。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里发布开源数字人框架 Mnn3dAvatar
阿里开源了名为「Mnn3dAvatar」的数字人框架,项目可以做到实时面捕然后映射到3D虚拟角色脸上(注意不是Live2D的,是3D的),甚至还能帮助创建一个3D虚拟角色。 https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md 据介绍,Mnn3dAvatar 是基于自研 3D 高斯溅射技术的 3D 数字人实时面捕方案,通过 AI 驱动实现高精度面部动作捕捉与实时渲染,支持语音、表情、手势等多模态驱动,可在手机、AR 设备等终端以90FPS 帧率流畅运行。 其核心优势在于将影视级数字人效果落地到消费级硬件,仅需普通手机摄像头即可替代传统动捕设备,显著降低直播场景的部署门槛与成本,制作周期缩短至一周内,成本仅为传统 CG 方案的 1/30。
- 下一篇
Stalwart —— 一体化邮件和协作服务器
Stalwart是一款开源邮件和协作服务器,支持 JMAP、IMAP4、POP3、SMTP、CalDAV、CardDAV 和 WebDAV,并具备丰富的现代功能。它采用 Rust 编写,安全、快速、健壮且可扩展。 主要特点: 具有完整协议支持的电子邮件服务器: JMAP: JMAP 用于邮件服务器。 用于 Sieve 脚本的 JMAP。 WebSocket、Blob 管理和配额扩展。 IMAP: IMAP4rev2和IMAP4rev1服务器。 ManageSieve服务器。 支持多种扩展。 POP3: POP3服务器。 STLS和SASL支持以及其他扩展。 SMTP: SMTP 服务器内置DMARC、DKIM、SPF和ARC支持消息认证。 通过DANE、MTA-STS和SMTP TLS报告实现强大的传输安全性。 通过细粒度的配置规则、筛选脚本、MTA 挂钩和 milter 集成进行入站限制和过滤。 具有延迟传送、优先传送、配额、路由规则和节流支持的分布式虚拟队列。 信封重写和消息修改。 协作服务器: 使用CalDAV进行日历和日程安排。 使用CardDAV进行联系人管理。 使用WebD...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7安装Docker,走上虚拟化容器引擎之路