苹果开源面向移动设备打造的小尺寸模型 OpenELM
在 WWDC24 之前,苹果在 Hugging Face 平台上发布了一个「具有开源训练和推理框架的高效语言模型」,名为 OpenELM。
官方介绍称:大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此,我们发布了 OpenELM,一个最先进的开源语言模型。
OpenELM 使用分层缩放策略,可以有效地分配 Transformer 模型每一层的参数,从而提高准确率。例如,在参数量约为 10 亿的情况下,OpenELM 与 OLMo 相比准确率提升了 2.36%,同时所需的预训练 tokens 数量仅有原来的 50%。
OpenELM 有四种尺寸:2.7亿、4.5亿、11亿和30亿个参数。而微软Phi-3模型为38亿,因此前者在小型机型上运行成本更低,可在手机和笔记本电脑等移动设备上运行,是做AI硬件的绝佳小模型。
OpenELM 核心特性如下
- 功能:该模型能够执行生成文本、代码、翻译、总结摘要等功能。
- 预训练数据:尽管最小的模型只有2.7亿参数,但苹果使用了1.8万亿tokens的数据进行预训练,这是其小参数下仍能表现出色的原因之一。
- 苹果的开源策略:苹果通常在手机领域采取闭源策略,但此次开源可能是为了吸引用户,未来可能会推出闭源产品实现商业化。
- 技术贡献:苹果不仅发布了模型权重和推理代码,还发布了完整的训练和评估框架,包括数据准备、模型训练、微调和评估流程,以及多个预训练检查点和训练日志。
- OpenELM架构:OpenELM的架构,包括其技术创新点,如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。
- 训练流程与数据集:苹果使用CoreNet作为训练框架,Adam优化算法,以及动态分词和数据过滤的方法。
论文地址:https://arxiv.org/abs/2404.14619
模型地址:https://huggingface.co/apple/OpenELM

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Atlassian 开源最强“实用”前端拖拽组件:性能和兼容性俱佳、支持跨窗口拖动、适用于任何前端框架
Pragmatic drag and drop 是一款前端拖拽组件,由知名软件开发公司 Atlassian 开源。 正如名字中的Pragmatic(“实用”)所言,该组件支持许多拖拽场景,十分注重性能,并且通过使用浏览器强大而灵活的内置拖拽功能变得安全而简单。 目前Atlassian 公司旗下核心产品 Trello、Jira 和 Confluence 等均使用了Pragmaticdrag and drop。 在 Pragmaticdrag and drop 之前,该组件作者 Alex Reardon 还打造了另一款流行的 React 开源拖拽组件react-beautiful-dnd。 与之相比,Pragmaticdrag and drop支持了更多的拖拽场景: 列表 面板 表格 树 Grids Drawing Resizing 下图展示了 Pragmatic Drag and Drop 在不同场景的运行效果: Pragmatic drag and drop 还支持在任何前端框架(如 React、Svelte、Vue、Angular)中使用,不受特定技术栈的限制。 在不同框架中使用的...
- 下一篇
PHP 在 2024 年还值得学习吗?
IOBE 在2024年 4 月榜单中曾指出,随着众多竞争对手进入市场以及语言本身出现的一些问题;PHP 已经不复往日辉煌,在 TIOBE 指数中的排名跌至历史最低点(第 17 位)。 在有关 PHP 已经日渐没落的言论四起的背景下,软件工程师 Sotiris Kourouklis近日发布了一篇名为“Is PHP still worth it in 2024 ?”的博客文章,对 PHP 语言进行了一番详尽的分析,探讨该语言在现代 Web开发中的实用性和效率。 并最终得出结论称,PHP 在 2024 年仍然是 Web 开发的一个不错选择。 以下为全文译文: 尽管许多人认为 PHP 是一种古老而不合格的语言,但在 2024 年,它仍然是所有网站中使用最多的语言。它的糟糕名声往往与 WordPress 有关,后者被认为是 21 世纪最糟糕的软件之一。 撇开 WordPress 不谈,让我们快速了解一下 PHP 以及为什么它在 2024 年可能是 Web开发的一个不错选择。 性能 PHP 随着时间的推移正在变得更快,尤其是最新版本,如 PHP 8.1 及以上版本,速度相当快。尽管在某些情况下它可...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程