Hugging Face 发布 Open Computer Agent,文字指令远程操控虚拟电脑
Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。
https://huggingface.co/spaces/smolagents/computer-agent
据介绍,Open Computer Agent 工具集成 smolagents、Qwen2-VL-72B(一款视觉语言模型)以及 E2B Desktop 等技术,可以远程执行打开应用等简单指令。
Open Computer Agent 内置了火狐 Firefox 浏览器等常用应用,能轻松响应打开某个网站或搜索导航路线等简单英文指令,但面对复杂任务时,工具的表现尚不理想。早期测试中,用户反馈其响应速度较慢,性能不稳定,甚至在处理 CAPTCHA 验证时频频出错。
该工具已向公众开放,但由于需求量大,用户可能需要在虚拟队列中等待体验机会。Hugging Face 坦言,这款工具并非追求完美,而是为了展示开源模型在云端运行的竞争力和成本优势。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
腾讯元宝上线新功能:一句话生成 Mermaid 图表
腾讯元宝宣布上线新功能:一句话生成Mermaid图表。 据介绍,只要在元宝里输入一句话,比如“帮我用Mermaid生成一张xxx流程图”,系统就会自动生成饼图、流程图、甘特图、时序图等。生成后,用户可以立刻预览效果,或者复制代码拿去其他地方使用。 Mermaid是一个开源的图表工具,非常好用,但过去用它需要写代码,很多人可能觉得麻烦。考虑到大家需要快速生成图表,又不想花时间写代码,我们就在元宝里直接支持了这些图表功能。 现在,只要在元宝里输入一句话,比如“帮我用Mermaid生成一张xxx流程图”,系统就会自动生成饼图、流程图、甘特图、时序图等。生成后,你可以立刻预览效果,或者复制代码拿去其他地方使用。 这个功能比较适合用在学术研究、工作报告、数据分析等场景,能帮助你把复杂的内容快速变成图表,让信息更直观,沟通也更高效。而且整个过程不需要任何代码,简化了操作,节省了制作图表的时间。
- 下一篇
Cursor CEO:未来软件开发不再依赖传统编程语言
知名 AI 编程工具 Cursor CEO Michael Truell 近日接受了播客《Lenny’s Podcast》访谈。 访谈中,Truell 提出「后代码时代」概念,强调未来的软件开发不再依赖传统编程语言,而是转向一种更抽象、更接近自然语言的逻辑表达方式。 基于这一概念,Truell 预言:“未来的工程师不再是记语法的人,而是理解系统、定义逻辑的人。他们更多在思考‘要实现什么’,而不是‘怎么实现’。” 同时,Truell 表示,AI 的加入正在让编程成为一种更接近自然语言的表达方式,代码将演变得如同「写英语」一样简单。他进一步解释,这样的转变将提高普通人参与软件设计的可能性,也让开发更高效、更易于理解。 另外,在谈及未来工程师所需技能时,Truell 强调「品味」(taste)的重要性,即对「构建什么」应该拥有清晰、正确的判断。 他指出,随着 AI 逐步接管底层实现,开发者将不再需要一丝不苟地处理每一个细节,而是要掌握如何定义系统行为与用户体验的能力。
相关文章
文章评论
共有0条评论来说两句吧...