LoRA —— 大型语言模型的低秩适应-低调大师

LoRA —— 大型语言模型的低秩适应

2023-04-13 735

LoRA 是 Low-Rank Adaptation of Large Language Models 的简写，即大型语言模型的低秩适应。它冻结了预训练模型的权重，并将可训练的秩分解矩阵注入到 Transformer 架构的每一层中，大大减少了下游任务的可训练参数数量。

与使用 Adam 微调的 GPT-3 175B 相比，LoRA 可以减少 10,000 倍的可训练参数数量和 3 倍的 GPU 内存需求。LoRA 在 RoBERTa、DeBERTa、GPT-2 和 GPT-3 上的模型质量表现与微调相当或更好，尽管可训练参数更少，训练吞吐量更高，而且与适配器不同，没有额外的推理延迟。

使用 RoBERTa (Liu et al., 2019) base and large 和 DeBERTa (He et al., 2020) XXL 1.5B 在 GLUE 基准上获得了与完全微调相当或优于完全微调的结果，同时只训练和存储了一小部分参数。

单击下面的数字下载 RoBERTa 和 DeBERTa LoRA 检查点

在 GPT-2 上，LoRA 优于完全微调和其他高效调优方法，例如适配器（Houlsby 等人，2019 年）和前缀调优（Li 和 Liang，2021 年）。下面是 E2E NLG Challenge、DART 和 WebNLG 的评估：

微信关注我们

原文链接：https://www.oschina.net/p/lora

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

每日一博 | 物流路由线路配载前端算法逻辑实现方案

作者：京东物流柳宏 1.前置知识 1.1 基本概念 1.1.1 配载配载代表着某条线路是否具有发往某个方向（区域、省市县、分拣等）的能力，也可以说是网点（分拣中心）是否具有承载配载所指方向货物的能力。一般网络规划者，在均衡线路间货量时，会通过调整配载来完成。线路上可允许配载货物的“产品类型、最终妥投目的地”，通过线路的配载，计算当前网点到目的网点的下一个网点，线路绑定的配载代表通过当前线路最终可以到达的目的地。以下图为例表示：如果放置在整个路由网络资源中，一个标记T1的货物要从北京发往福建，可选的路由有①北京站-北京-武汉-福建-福建站；②北京站-北京-广州-福建-福建站；之所以剔除了北京站-北京-上海-福建-福建站以及北京站-北京-武汉-上海-福建-福建站，正是因为后两条线路中未包含T1的配载代码，只标记了T2 ,说明这条线路只有配载航空的货物，而没有普通陆运的带货能力。下图就是用于描述配载的树形结构 1.1.2 班期与生失效日期班期：指的是发运频率，1234567代表着每周七天中，这个班次的“上线时间”，一般来讲，维护时缺失某个值，会造成路由中断的...

2023-04-13

318

很多科技公司都会推出漏洞悬赏计划，为的是让外部安全研究人员能够积极发现和报告漏洞，以此来提升企业安全。日前，正处于变革漩涡最中心的 AI 研究公司 OpenAI 宣布推出一项漏洞悬赏计划（Bug Bounty Program），该计划的目的也一样，就是希望研究人员可以帮助解决语言模型在日益强大的同时所带来的网络安全风险。该计划由 OpenAI 与网络安全公司 Bugcrowd 合作运营，研究人员可以将找到的漏洞报告给 OpenAI，之后 OpenAI 将根据漏洞严重程度给予 200 到 2 万美元不等的经济奖励。该计划也是 OpenAI 为开发更安全和更先进 AI 的一种承诺，也符合 OpenAI 的宗旨 ——「我们的使命是确保通用人工智能造福全人类」。在这类 AI 产品帮助用户提高效率的同时，人们对可以生成文本、图像和其他媒体内容的人工智能系统的漏洞和安全性也越来越关注。上个月，ChatGPT 曾因为开源库 redis-py 中的一个漏洞导致包括用户的姓名、电子邮件地址、账单地址、信用卡号码的最后四位数和信用卡到期日等信息泄漏。近日，还有一个名叫 Alex Albert 的大...

2023-04-13

364

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。