您现在的位置是:首页 > 文章详情

昆仑万维发布 Skywork R1V4-Lite

日期:2025-11-18点击:9

昆仑万维正式发布 Skywork R1V4-Lite,一款集成视觉操作、推理与规划的轻量级多模态智能体。不仅能进行深度推理,还在同一模型中统一了主动图像操作、外部工具调用、多模态深度研究三大能力。

与传统只能“看图回答”的模型不同,Skywork R1V4-Lite能够在真实场景中随手拍照即可完成复杂任务:自动旋转图像判断空间位置、多次放大读取模糊文字、绘制辅助线验证几何关系、跨模态搜索定位真实地点等等。这意味着用户不需要设计提示词,不需要提供额外信息,只需拍一张图,Skywork R1V4-Lite就能自己观察、操作、推理并给出答案。

基准测试结果表明,Skywork R1V4-Lite 在8个多模态理解基准评测上整体领先Gemini 2.5 Flash,其中5个任务上超过Gemini 2.5 Pro的水平。

Skywork R1V4-Lite 也支持接入联网搜索功能,在联网搜索下会自动触发深度研究能力。从结果上看,R1V4-Lite在多模态DeepResearch类任务中展现出了领先趋势:在mm-search上以66分超过Gemini 2.5 Flash的64.9分,在FVQA上以67分显著领先Gemini 2.5 Flash的60.8分。

昆仑万维方面表示:

R1V4-Lite的成功不仅来自工程优化,更源自其背后的多模态新范式:图像操作×深度推理交织训练。这一训练路线让轻量模型具备跨模态推理、主动图像操作、任务规划与搜索增强的统一能力,展示了轻量多模态智能体的全新可能性。

这一结果进一步说明:能力密度比参数规模更重要,小模型也能逼近闭源模型的真实表现。随着更大容量与更强结构进一步加入该范式,其scaling潜力将持续释放。目前,Skywork R1V4-Pro也即将准备发布。

原文链接:https://www.oschina.net/news/384217
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章