苹果将大语言模型部署到设备本地
苹果研究团队在预印本平台 arxiv 发表论文《LLM in a flash》,介绍了一项全新的闪存技术,让苹果可以在其内存有限的设备上部署大语言模型。
研究团队表示,他们通过将模型参数存储在闪存 (Flash Memory) 中——也就是储存应用和照片的地方,解决了有效运行大语言模型容量的挑战。与传统用于运行大语言模型的 RAM 相比,闪存在移动设备中容量要大得多。
论文指出,这项技术可以让 AI 模型的运行规模达到 iPhone 可用内存的两倍。在这项技术的加持之下,LLM 的推理速度在 Apple M1 Max CPU 上提高了 4-5 倍,在 GPU 上提高了 20-25 倍。
延伸阅读

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
国家大模型标准测试首批通过名单公布:含阿里通义千问、腾讯混元等
在 12 月 22 日的全国信息技术标准化技术委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,首批通过评测的大模型共有 4 款,包括:腾讯混元大模型、阿里通义千问大模型。 据介绍,“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的 30 余项具体评测维度。 阿里方面介绍称,通义千问是本次通过的首次大模型中唯一的开源模型。 腾讯方面介绍称,腾讯混元大模型符合《人工智能大规模与训练模型 第 2 部分:测评指标与方法》语言大模型的相关技术要求。该模型号称拥有超千亿参数规模、预训练语料超 2 万亿 tokens。 同时,阿里云、腾讯云分别以技术牵头方、提案牵头方的身份启动《人工智能模型即服务(MaaS)功能要求》的讨论与编制。
- 下一篇
Golang 通用代码生成器仙童发布 2.4.0 电音仙女尝鲜版一及其介绍两个模式的视频
Golang 通用代码生成器仙童发布 2.4.0 电音仙女尝鲜版一及其介绍两个模式的视频 Golang 通用代码生成器仙童已发布 2.4.0 电音仙女尝鲜版一及其介绍视频。视频请见: 正常模式: https://www.bilibili.com/video/BV1fw411V77i/ 哑数据模式: https://www.bilibili.com/video/BV1nu4y1K7sz/ 电音仙女版本支持日期和日期时间。支持三大部分生成功能群。支持枚举。支持哑数据模式。支持用户管理自己的资料和密码。技术状态和最新版的 Rust 通用代码生成器红莲的技术状态一致。非常便利大家的使用。 代码生成器项目地址:https://gitee.com/jerryshensjf/Fairchild二进制发布包下载地址:https://gitee.com/jerryshensjf/Fairchild/attach_files Go语言通用代码生成器:仙童 简介 Go语言通用代码生成器:仙童 百度话题 #通用代码生成器# 版本更新 Golang通用代码生成器仙童已发布 2.4.0 电音仙女(TechnoFa...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19