智源开源多模态向量模型 BGE-VL
智源研究院宣布联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
BGE-VL借助大规模合成数据MegaPairs训练而成。这一设计具备以下两大核心优势:
- 优异的可扩展性:MegaPairs 结合多模态表征模型、多模态大模型和大语言模型,在海量图文语料库中高效挖掘多模态三元组数据。其算法能够以极低成本持续生成多样化且高质量的多模态三元组。本次发布的版本涵盖 2600 万条样本,为多模态检索模型的训练提供了大规模、高价值的数据支持。
- 卓越的数据质量:相较于传统人工标注数据,MegaPairs 仅需 1/70 的数据量即可实现更优的训练效果。利用该合成数据,智源训练了多模态检索模型 BGE-VL,显著提升了多个主流多模态检索基准的性能。
BGE-VL的技术报告已发布,相关数据、模型及代码资源将陆续向社区全面开放。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
vivo OS 部门设立 AI 领域板块
据雷锋网独家消息,vivo 近日进行了组织架构调整,其中其 AI 领域有了新的变动。 具体来看,vivo 原 OS 产品领域下将设立 AI 领域,人工智能一部、人工智能二部划入 AI 领域。原互联网平台运营领域总经理张飞被调任 AI 领域总经理,并兼管人工智能一部,无考察期,直接向公司副总裁、OS 产品领域负责人周围汇报。而原人工智能一部总经理肖方旭已于 1 月份离职。 据 vivo 员工透露,公司在 AI 大模型方面投入巨大,前期管理意志干预很重,可实际看来技术进展缓慢,此事早在去年内部就有过讨论,最终结果是暂时不做商业化考核,但暂停了对资金的投入。 报道指出,目前 vivo 的大模型训练重心正在向端侧转移,云端的 700 亿参数大语言模型还在微调和优化中,暂停了该模型的预训练工作。 公开资料显示,vivo 每年都会投入 20-30 亿用于大模型研发。截至 2024 年 10 月,vivo 在 AI 领域的投入已经超过 230 亿元,且 AI 研究院的研发人员数量也从 2019 年的 1 千人增加至 2 千多人,是目前公开披露 AI 投入最高的手机厂商之一。
- 下一篇
优刻得支撑全球首款 AI 多智能体开发团队 MGX 上线
近日,全球首款AI多智能体开发团队MGX(MetaGPT X)上线,由优刻得云平台提供核心算力支持。作为一个极具创新性的 AI 软件开发团队,在MGX平台无需写一行代码,仅说出需求,再通过多位AI Agent的智能分工,就能帮助企业及个人用户从0到1完成应用开发。 MGX是由厦门深度赋智科技有限公司(下称:DeepWisdom)所倾力打造的一款多智能体编程平台,基于Multi-Agent(多智能体)开源框架MetaGPT 带来颠覆性行业变革。 MGX以多智能体解放社会生产力,其爆火的背后,不仅依托优刻得高性能的训练和推理算力能力加速模型迭代,提升Agent协作效能。同时受益于优刻得海外数据中心的资源支持,为MGX的全球用户提供低延迟、高稳定的应用服务体验。 Agent领域的国产之光 让开发像“对话”一样简单 DeepWisdom成立于2019年,专注于AI Infra的开发及商业落地,希望通过搭建AgentStack(智能体底层架构),完成各领域Agent的大规模生产。作为全球首个完全模拟人类软件工作流程的多Al Agent开发平台,MGX实现了"零代码构建全栈应用"的创新突破。 MG...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题