智源开源多模态向量模型 BGE-VL
智源研究院宣布联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
BGE-VL借助大规模合成数据MegaPairs训练而成。这一设计具备以下两大核心优势:
- 优异的可扩展性:MegaPairs 结合多模态表征模型、多模态大模型和大语言模型,在海量图文语料库中高效挖掘多模态三元组数据。其算法能够以极低成本持续生成多样化且高质量的多模态三元组。本次发布的版本涵盖 2600 万条样本,为多模态检索模型的训练提供了大规模、高价值的数据支持。
- 卓越的数据质量:相较于传统人工标注数据,MegaPairs 仅需 1/70 的数据量即可实现更优的训练效果。利用该合成数据,智源训练了多模态检索模型 BGE-VL,显著提升了多个主流多模态检索基准的性能。
BGE-VL的技术报告已发布,相关数据、模型及代码资源将陆续向社区全面开放。