昆仑万维发布 Skywork R1V4-Lite
昆仑万维正式发布 Skywork R1V4-Lite,一款集成视觉操作、推理与规划的轻量级多模态智能体。不仅能进行深度推理,还在同一模型中统一了主动图像操作、外部工具调用、多模态深度研究三大能力。 与传统只能“看图回答”的模型不同,Skywork R1V4-Lite能够在真实场景中随手拍照即可完成复杂任务:自动旋转图像判断空间位置、多次放大读取模糊文字、绘制辅助线验证几何关系、跨模态搜索定位真实地点等等。这意味着用户不需要设计提示词,不需要提供额外信息,只需拍一张图,Skywork R1V4-Lite就能自己观察、操作、推理并给出答案。 基准测试结果表明,Skywork R1V4-Lite 在8个多模态理解基准评测上整体领先Gemini 2.5 Flash,其中5个任务上超过Gemini 2.5 Pro的水平。 Skywork R1V4-Lite 也支持接入联网搜索功能,在联网搜索下会自动触发深度研究能力。从结果上看,R1V4-Lite在多模态DeepResearch类任务中展现出了领先趋势:在mm-search上以66分超过Gemini 2.5 Flash的64.9分,在FVQA上以...
