苹果公布多模态大模型 MM1 :具备 300 亿参数、MoE 架构
Arxiv 页面显示,苹果正式公布了自研多模态大模型 MM1,该模型提供 30 亿、70 亿、300 亿三种参数规模,拥有图像识别和自然语言推理能力。
论文显示,MM1多模态大模型由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现 SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。
MM1 在上下文预测、多图像和思维链推理等方面具有不错的表现。同样,MM1 在指令调优后展现出了强大的少样本学习能力。
根据介绍,苹果研究团队相关论文主要是利用 MM1 模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
开源日报 | RISC-V 正在发生质变?离职后可以删除自己所写的软件吗
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.3.15 今日要点 OpenSource Daily Intel 6.2GHz 限量旗舰 i9-14900KS 正式发布 Intel 正式发布了酷睿 14 代家族的顶级限量版本,酷睿 i9-14900KS,国行定价 6299 元。它在历史上第一次将 PC 处理器的加速频率做到了惊人的 6.2GHz,比上代限量版 i9-13900KS 又高出 200MHz。 i9-14900KS 可以看作是 i9-14900K 的特挑加速版,同样都是 8P+16E 24 核心 32 线程、32MB 二级缓存、36MB 三级缓存、UHD 770 核芯显卡,内存支持 DDR4-3200、DDR5-5600,最大容量 192GB,扩展支持 16 条 PCIe 5.0、4 条 PCIe 4.0,兼容 Z690、Z790 主板。 80 岁图灵奖得主再度出山,打造基于数据库的云原生操作系统 DBOS 本来以为教授该颐养天年了,没想到以 80 岁高龄,再度出山。这次老爷子还跨界了,把手伸到了操作系统领域,要把操作系统建在数据库上。 DBOS...
- 下一篇
北京将发布第一代通用开放人形机器人本体
北京青年报消息称,最近,北京人形机器人创新中心传来好消息,近期将发布第一代通用开放人形机器人本体。 北京人形机器人创新中心相关负责人介绍,该中心主要面向人形机器人核心器件、通用本体、通用大模型、运动控制系统、工具链和开源社区等人形机器人行业短板和痛点开展技术攻关,将为整个行业打造出共性技术平台、公共服务平台以及规范人形机器人相关标准等,总体来说,中心将围绕人形机器人产业通用部分发力,服务整个行业发展。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装Docker,最新的服务器搭配容器使用
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19