LoRA —— 大型语言模型的低秩适应
LoRA 是 Low-Rank Adaptation of Large Language Models 的简写,即大型语言模型的低秩适应。它冻结了预训练模型的权重,并将可训练的秩分解矩阵注入到 Transformer 架构的每一层中,大大减少了下游任务的可训练参数数量。
与使用 Adam 微调的 GPT-3 175B 相比,LoRA 可以减少 10,000 倍的可训练参数数量和 3 倍的 GPU 内存需求。LoRA 在 RoBERTa、DeBERTa、GPT-2 和 GPT-3 上的模型质量表现与微调相当或更好,尽管可训练参数更少,训练吞吐量更高,而且与适配器不同,没有额外的推理延迟。
使用 RoBERTa (Liu et al., 2019) base and large 和 DeBERTa (He et al., 2020) XXL 1.5B 在 GLUE 基准上获得了与完全微调相当或优于完全微调的结果,同时只训练和存储了一小部分参数。
单击下面的数字下载 RoBERTa 和 DeBERTa LoRA 检查点
在 GPT-2 上,LoRA 优于完全微调和其他高效调优方法,例如适配器(Houlsby 等人,2019 年)和前缀调优(Li 和 Liang,2021 年)。下面是 E2E NLG Challenge、DART 和 WebNLG 的评估:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 物流路由线路配载前端算法逻辑实现方案
作者:京东物流 柳宏 1.前置知识 1.1 基本概念 1.1.1 配载 配载代表着某条线路是否具有发往某个方向(区域、省市县、分拣等)的能力,也可以说是网点(分拣中心)是否具有承载配载所指方向货物的能力。一般网络规划者,在均衡线路间货量时,会通过调整配载来完成。 线路上可允许配载货物的“产品类型、最终妥投目的地”,通过线路的配载,计算 当前网点 到 目的网点 的 下一个网点 ,线路 绑定的配载代表通过当前线路最终可以到达的目的地 。以下图为例 表示:如果放置在整个路由网络资源中,一个标记T1的货物要从北京发往福建,可选的路由有①北京站-北京-武汉-福建-福建站;②北京站-北京-广州-福建-福建站;之所以剔除了北京站-北京-上海-福建-福建站以及北京站-北京-武汉-上海-福建-福建站,正是因为后两条线路中未包含T1的配载代码,只标记了T2 ,说明这条线路只有配载航空的货物,而没有普通陆运的带货能力。 下图就是用于描述配载的树形结构 1.1.2 班期与生失效日期 班期:指的是发运频率,1234567代表着每周七天中,这个班次的“上线时间”,一般来讲,维护时缺失某个值,会造成路由中断的...
- 下一篇
OpenAI 推出漏洞悬赏计划,最高 2 万美元
很多科技公司都会推出漏洞悬赏计划,为的是让外部安全研究人员能够积极发现和报告漏洞,以此来提升企业安全。 日前,正处于变革漩涡最中心的 AI 研究公司 OpenAI 宣布推出一项漏洞悬赏计划(Bug Bounty Program),该计划的目的也一样,就是希望研究人员可以帮助解决语言模型在日益强大的同时所带来的网络安全风险。 该计划由 OpenAI 与网络安全公司 Bugcrowd 合作运营,研究人员可以将找到的漏洞报告给 OpenAI,之后 OpenAI 将根据漏洞严重程度给予 200 到 2 万美元不等的经济奖励。该计划也是 OpenAI 为开发更安全和更先进 AI 的一种承诺,也符合 OpenAI 的宗旨 ——「我们的使命是确保通用人工智能造福全人类」。 在这类 AI 产品帮助用户提高效率的同时,人们对可以生成文本、图像和其他媒体内容的人工智能系统的漏洞和安全性也越来越关注。 上个月,ChatGPT 曾因为开源库 redis-py 中的一个漏洞导致包括用户的姓名、电子邮件地址、账单地址、信用卡号码的最后四位数和信用卡到期日等信息泄漏。近日,还有一个名叫 Alex Albert 的大...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品
- CentOS7安装Docker,走上虚拟化容器引擎之路