阶跃星辰多模态“小核弹” Step3-VL-10B 开源-低调大师

阶跃星辰多模态“小核弹” Step3-VL-10B 开源

2026-01-20 173

阶跃星辰宣布开源 Step3-VL-10B，包括 Base 模型和 Thinking 模型，性能超越 20 倍大模型。

公告称，仅用 10B 参数量，Step3-VL-10B 在视觉感知、逻辑推理、数学竞赛以及通用对话等一系列基准测试中均达到同规模 SOTA 水平，并且解决了参数量小和智能水平高难以兼优的行业难题。

在多项关键评测中，Step3-VL-10B 媲美甚至超越规模大 10-20 倍开源模型（如 GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B）以及顶级闭源旗舰模型（如 Gemini 2.5 Pro、Seed-1.5-VL）。

基于这样一个小而强底座，原本只能在云端运行的复杂多模态推理（如 GUI 操作、复杂文档解析、高精度计数）能够下沉到手机、电脑甚至工业嵌入式设备中。

Step3-VL-10B 具备三大核心亮点：

极致视觉感知标杆：在同参数量级中展现出顶尖的识别与感知精度。通过引入 PaCoRe（并行协调推理）机制，模型在复杂计数、高精度 OCR 及空间拓扑理解等高难度任务上的可靠性实现了质的飞跃。
深层逻辑推演与长程推理：得益于规模化强化学习（RL）的持续迭代，Step3-VL-10B 在 10B 规模上实现了跨任务推理能力的阶跃。无论是竞赛级数学难题、真实编程环境还是视觉逻辑谜题，模型均能通过严密的多步思维链推导出最终答案。
强大端侧 Agent 交互：基于海量 GUI（图形用户界面）专用预训练数据，模型能够精准识别并操作复杂界面，成为端侧 Agent 的核心引擎。

Step3-VL-10B 提供 SeRe（顺序推理）和 PaCoRe（并行协调推理）两种范式，在STEM 推理、识别、OCR & 文档、GUI Grounding、空间理解、代码等核心维度，都取得了千亿级别模型的优秀分数，PaCoRe范式表现更优。

更多详情可查看官方公告。

微信关注我们

原文链接：https://www.oschina.net/news/398177

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里推出 AIGC 设计应用“呜哩 (Wuli)”，集成通义千问图像模型

阿里巴巴推出了一款名为“呜哩”的AIGC创意设计生产力平台，并已正式开启测试。 https://wuli.art/generate 该平台旨在为内容创作者、设计师及营销人员提供一套高效多元的AI创意生成解决方案。平台深度整合了通义千问团队研发的多款图像大模型，形成一个模型全家桶。其中包括主打高质量的Qwen Image25.12生成模型、追求极致响应速度的Qwen Image Turbo模型，以及专注于细节调整的Qwen Image25.11编辑模型。用户可根据不同创作需求，在生成质量、速度与可控性之间灵活选择。在功能层面，呜哩平台提供了从图片生成、视频生成到灵感联想、翻译辅助及资源库支持的完整工具集，可帮助用户跨越创意瓶颈。用户通过输入简单的描述，即可快速生成如3D艺术字体、电影风格海报、电商场景图在内的丰富内容。

2026-01-20

149

时序数据库Apache IoTDBV2.0.6、V1.3.6 已经发布！ V2.0.6 版本作为树表双模型正式版本，新增表模型查询写回功能，新增位操作函数（内置标量函数）以及可下推的时间函数，同时对数据库监控、性能、稳定性进行了全方位提升。 V1.3.6 版本作为1.X 系列的维护升级版本，围绕查询性能、数据同步稳定性、内存管理机制三大核心方向进行深度优化，对数据库监控、性能、稳定性进行了全方位提升。欢迎点击访问 IoTDB 官网下载开源版试用！欢迎在我们的网站下载最新版本： https://iotdb.apache.org/Download/ 完整的 Release Notes 可参考此处： https://raw.githubusercontent.com/apache/iotdb/rc/2.0.6/RELEASE_NOTES.md https://raw.githubusercontent.com/apache/iotdb/rc/1.3.6/RELEASE_NOTES.md 当前 Release 可在此处下载： http://iotdb.apache.org/Downlo...

2026-01-20

114

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。