阶跃星辰发布多模态推理模型 Step-R1-V-Mini-低调大师

阶跃星辰发布多模态推理模型 Step-R1-V-Mini

2025-04-09 313

阶跃星辰宣布推出全新多模态推理模型 Step-R1-V-Mini，支持图文输入、文字输出、有良好的指令遵循和通用能力，能够高精度感知图像并完成复杂推理任务。

技术亮点

为了提升模型在多模态协同场景下的推理表现，开发团队在训练方法上做了两项重要尝试：

第一，多模态联合强化学习

Step-R1-V-Mini 的训练路径基于 PPO 强化学习策略，在图像空间引入 verifiable reward 来解决图片空间推理链路复杂、容易产生混淆的相关和因果推理错误的问题。相较 DPO 等方法，在处理图像空间的复杂链路时更具泛化性与鲁棒性。

第二，充分利用多模态合成数据

目前多模态数据的反馈信号相对难以获得。设计了大量基于环境反馈的多模态数据合成链路，合成了可规模化训练的多模态推理数据，并通过基于 PPO 的强化学习训练同步提升模型文本和视觉的推理能力，有效避免了训练跷跷板问题。

公告称，Step-R1-V-Mini 在多个公开榜单中表现亮眼，在 MathVision 视觉推理榜单位列国内第一，在视觉推理、数学逻辑和代码等方面表现优异。

目前，Step-R1-V-Mini 已正式上线阶跃AI 网页端，并在阶跃星辰开放平台提供 API 接口。

微信关注我们

原文链接：https://www.oschina.net/news/343509

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《2025 年人工智能指数报告》发布

李飞飞联合斯坦福大学人工智能研究所（Stanford HAI）发布了《2025人工智能指数报告》(Artificial Intelligence Index Report 2025)。报告于2025年4月7日发布，由来自学术界和产业界的跨学科专家组成的AI指数指导委员会主导编制。该报告持续追踪人工智能领域多项关键进展，主要包括：年度重大技术突破、基准测试新纪录、生成式AI投资动向、教育领域应用趋势、技术监管立法进程等核心维度。今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算，以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据，并扩大了对 AI 在科学和医学中日益重要作用的报道。下面看看这份报告揭示的 2024 年 AI 行业 12 大趋势： 1.AI 在苛刻基准上的表现持续提升 2023 年，研究人员引入了新的基准——MMMU、GPQA 和 SWE-bench，以测试高级 AI 系统的极限。仅仅一年后，性能大幅提升：在 MMMU、GPQA 和 SWE-bench 上的得分分别提高了 18.8、48.9 和 67.3...

2025-04-08

677

斯坦福大学人类中心人工智能研究所（HAI）已于近日发布了《2025年人工智能指数报告》，全面梳理了2024年全球AI领域的最新趋势和技术进展，揭示了人工智能在性能提升、成本下降及全球应用上的惊人变化。性能差距缩小，AI技术进入白热化阶段报告显示，AI模型的性能差距正在迅速收窄。顶级模型与排名第十的模型在关键基准测试上的差距从2023年的11.9%骤降至2024年的5.4%，反映出前沿技术竞争的激烈程度。与此同时，开源模型与闭源模型的性能差距也从8%缩小至1.7%，表明开源生态的快速崛起正对传统闭源巨头构成挑战。在短时任务（2小时内）测试中，AI代理的得分更是达到人类的4倍，凸显了其在高效执行任务上的潜力。特别值得关注的是，中美两国顶级AI模型的性能差距已缩小至惊人的0.3%。2023年，中国顶尖模型在多项基准测试中尚落后美国近20个百分点，而短短一年后，这一差距几近抹平。成本骤降，AI普及加速报告指出，AI技术的经济性显著提升。自2022年以来，推理成本下降了惊人的280倍，而硬件成本每年降低约30%。这一趋势大幅降低了AI部署的门槛，使其从实验室走向更广泛的实际应用。例如...

2025-04-09

331

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。