阿里发布面向真实执行场景训练的智能体模型：ROME-V0.1-低调大师

阿里发布面向真实执行场景训练的智能体模型：ROME-V0.1

2026-01-09 158

阿里巴巴未来生活实验室与智能引擎、数据技术团队正式发布智能体模型ROME-V0.1（ROME is Obviously an Agentic ModEl）。

在多项主流 Agent 基准测试中，IFLow-CLI + ROME-V0.1在同规模开源模型中取得了领先结果，并在部分榜单上接近 100B+ 参数规模模型——例如，在 Terminal-Bench 2.0 上达到 24.72% 的成功率，在 SWE-bench Verified 上取得 57.40% 的任务完成率。

ROME-V0.1 是面向真实执行场景训练的智能体模型，其并非针对某些单一评测的优化，而是建立在大规模真实环境交互、端到端执行闭环训练以及面向长链任务的强化学习范式之上。得益于完善的训练系统基建--ALE（Agentic Learning Ecosystem），ROME-V0.1 在超过百万数量级别的可验证交互轨迹上完成训练。

详细介绍查看：https://mp.weixin.qq.com/s/9qM6iDu9yeagJa-Z9BFtcQ

微信关注我们

原文链接：https://www.oschina.net/news/395291

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2025 年 Q4“方升-多模态”大模型基准测试结果发布

中国信息通信研究院近日组织完成 2025 年第四季度多模态大模型专项测试工作，最新体系和测试结果如下： 2025年11月至12月测试涵盖多模态理解、文生图与文生视频三项任务，共评估30个模型，其中包括10个多模态理解大模型、10个视频生成模型和10个图像生成模型。 1、多模态理解任务测试结果多模态理解任务测试旨在考察模型对图像、文本、图表等信息的深层解析与逻辑推理能力，涵盖函数求解、几何分析、表格分析、身份分析、色彩分析、未来预测、关系分析、物理推理、IQ问题维度本此测试10个多模态理解大模型，其中国内模型5个，国外模型5个，包括Google Gemini-3-pro-preview、OpenAI GPT-5.2-high、智谱GLM-4.6V、字节跳动Doubao-Seed-1-6-vision-250815等代表性模型。测试结果显示：一是谷歌Gemini-3-pro-preview综合得分位居榜首，其表现小幅领先于 GPT-5.2-High，并显著优于 GLM-4.6V。二是国内模型之间差距较小，GLM-4.6V、Doubao-Seed-1-6-vision与 Qwen3-VL...

2026-01-09

127

阿里云宣布与乐聚机器人达成全栈 AI 合作。双方将基于阿里云的算力、AI 平台及其通义千问大模型，共同推进人形机器人训练场的构建，并探索面向人形机器人产品的具身智能联合解决方案。此次合作的核心在于，将乐聚在机器人本体硬件及产业化方面的积累，与阿里云强大的 AI 基础设施深度融合。目前，乐聚新版展厅机器人已成功接入千问大模型，其语音交互和实时对话的响应速度、准确性与自然度得到显著提升。与此同时，乐聚机器人已向魔搭社区开源了其人形机器人真机数据集，推动行业技术共享。双方计划通过 “算力 + AI 平台 + 大模型” 的全栈协同，优化机器人数据采集流程，探索 “具身大脑 + 本体 + 小脑” 的技术融合新路径，并加速具身智能解决方案在工业、商业服务及家庭等多个场景的规模化落地。乐聚成立于 2016 年，此前已经完成了多轮融资，投资者包括青橙资金、深创投、腾讯、洪泰基金等。值得注意的是，乐聚也是国内最早一批做人形机器人的企业，核心团队来自哈尔滨工业大学，多位为 90 后。乐聚已推出多款人形机器人产品，包括 Kuavo、Aelos、Roban，应用于工业智造、商业服务、科研教育等。其中，K...

2026-01-09

127

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。