您现在的位置是:首页 > 文章详情

抖音与 LV-NUS 联合推出 SAIL-VL2 模型

日期:2025-10-14点击:8

抖音 SAIL 团队与 LV-NUS Lab 联手推出了一款名为 SAIL-VL2 的多模态大模型,并已开源。这个新模型在保持较小参数规模的同时,还在复杂推理任务中超过了许多同类模型,甚至能与更大型的闭源模型相抗衡。

SAIL-VL2的参数设置分为2B 和8B,在106个数据集上实现了性能的突破,尤其在 MMMU、MathVista 等复杂推理基准测试中表现优异。SAIL-VL2在数据、训练及架构设计上进行了三大方面的创新。

在架构设计上,SAIL-VL2引入了稀疏混合专家(MoE),以优化性能和计算效率。其视觉编码器 SAIL-ViT 采用渐进式优化,逐步提升视觉 - 语言的对齐能力。这种创新设计使得 SAIL-VL2在推理时仅需激活部分参数,大幅度提升了模型的计算效率。

数据层面上,SAIL-VL2构建了高质量的多模态语料库,通过评分过滤和合成增强手段,确保数据的准确性和多样性。同时,团队还设计了一套渐进式的训练框架,从基础感知逐步过渡到复杂推理,使得模型在不同任务中的表现更加出色。

通过全链路优化,SAIL-VL2在基础模型的性能上取得了显著进展。数据显示,该模型在多项基准测试中脱颖而出,其8B 规模的模型在推理能力上,已然与最新的 GPT-4o 不相上下。

原文链接:https://www.oschina.net/news/377404
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章