首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/283529

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

苹果公布多模态大模型 MM1 :具备 300 亿参数、MoE 架构

Arxiv 页面显示,苹果正式公布了自研多模态大模型 MM1,该模型提供 30 亿、70 亿、300 亿三种参数规模,拥有图像识别和自然语言推理能力。 论文地址:https://arxiv.org/pdf/2403.09611.pdf 论文显示,MM1多模态大模型由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现 SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。 MM1 在上下文预测、多图像和思维链推理等方面具有不错的表现。同样,MM1 在指令调优后展现出了强大的少样本学习能力。 根据介绍,苹果研究团队相关论文主要是利用 MM1 模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。

博通 CEO 承认 VMware 社区存在“一些不安”

博通 (Broadcom) 首席执行官 Hock Tan 将其收购 VMware 后的第一个百天评价为“一个良好的开端”。但他也承认,这家虚拟化巨头的快速变化让一些人难以消化。 Tan 在博通公司的博客上写道: 虽然还有很多工作要做,但我们在打造全球领先的基础设施技术公司方面已经取得了实质性进展。在评估和收购 VMware 的 18 个月过程中,我们审视了一切,以确定为客户创造更多价值所需的条件。自 11 月底完成收购以来,我们采取了果断行动来提高客户价值。 我们彻底改革了我们的软件产品组合、进入市场的方法和整体组织结构。我们改变了销售软件的方式和对象。我们已经完成了从 2019 年开始加速的软件业务模式转型,从销售永久软件到仅订阅许可(行业标准)。 当然,我们认识到这种程度的变化给我们的客户和合作伙伴带来了一些不安,这是可以理解的。但所有这些举措都是为了更快地创新、更有效地满足客户的需求以及让与我们开展业务变得更容易。我们还期望这些变化能够为我们的合作伙伴提供更大的盈利能力和更好的市场机会。 他接着还提到了 VMware 的 Cloud Foundation 产品,承诺将投入 10 ...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。