70 亿参数大语言模型 RedPajama 7B 完整版发布,开源可商用
TOGETHER 宣布其 RedPajama 7B 已完成所有训练,并在 Apache 2.0 许可下全部开源。
RedPajama 是一个开源可商用大模型项目,由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama 基础数据集(5 TB 大小),自 4 月份发布至今已被下载数千次,并被用来训练了 100 多个模型;以及一个在 5 月份就宣布训练完成的 RedPajama 3B,和刚宣布训练完成的 RedPajama 7B 大模型。
- RedPajama-INCITE-7B-Base 在 RedPajama-1T 数据集的 1T tokens 上进行训练,并发布了训练和开放数据生成脚本的 10 个 checkpoints,允许模型的完全可重复性。该型号在 HELM 上落后 LLaMA-7B4 分,落后 Falcon-7B/MPT-7B 1.3 分。
- RedPajama-INCITE-7B-Instruct 是 HELM 基准测试中得分最高的开放模型,使其成为各种任务的理想选择。它在 HELM 上的性能表现相较 LLaMA-7B 和目前最先进的开放模型如 Falcon-7B (Base and Instruct) 和 MPT-7B (Base and Instruct) 均高出2-9分。
- RedPajama-INCITE-7B-Chat 在 OpenChatKit 中可用,包括一个用于轻松微调模型的训练脚本,现在可以试用。聊天模型建立在完全开源的数据之上,不使用来自 OpenAI 等封闭模型的提炼数据 - 确保在开放或商业应用程序中的使用。
其中,Base 模型是基础大语言模型,在 RedPajama 数据集上进行了训练,采用和 Pythia 模型一样的架构。LM Harness 结果:
Instruct 则是基于 Base 模型针对 few-shot prompts 微调的结果,通过对 P3 (BigScience) 和 Natural Instruction (AI2) 的各种 NLP 任务进行训练,针对少样本性能进行了优化。Instruct 版本在少数几个任务上表现出优异的性能,超过了类似规模的领先开放模型;RedPajama-INCITE-7B-Instruct 似乎是此类规模下最好的开放式指令模型。HELM 基准测试结果:
此外,官方还宣布正在开发新版本的 RedPajama,即 RedPajama2,目标是在 2-3T tokens 数据集上进行训练。主要有以下规划:
- 尝试基于 DoReMi 类似的技术来自动学习不同数据的混合。
- 引入 Pile v1(来自 Eleuther.ai)和 Pile v2(CrperAI)等数据集,以丰富当前数据集的多样性和规模。
- 处理更多的 CommonCrawl。
- 探索更多的数据去重复策略。
- 引入至少 1500 亿 tokens 的代码数据集,以帮助提高编码和推理任务的质量。
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
苹果推出游戏移植工具,能否撬动 Windows 蛋糕
自从苹果开始将 Mac 的处理器从英特尔转向 Apple Silicon 之后,大家都已经见识到 Apple Silicon 的实力了。M1 和 M2 系列的处理器相比以往的英特尔处理器,在 CPU、GPU 方面都有了巨大的性能提升,尤其是功耗比,更是无人能及。 抛开台式机不谈,这样的性能以及极低的功耗肯定是让一众 Windows 游戏本羡慕不已,那么自然而然苹果也打起了游戏的主意。 在 WWDC 2023 上,苹果在新发布的 macOS 14 Sonoma 中新增了一个游戏模式,该模式可以改进游戏过程中的 CPU 和 GPU 的调度,带来更好的游戏体验和更稳定的帧率;游戏模式还可以大大降低耳机、游戏手柄等外设的延迟。 苹果已经为玩游戏打下了很好的基础,那么 Mac 平台缺少游戏,尤其是 3A 大作的问题该怎么解决呢? 苹果日前公布了一个新的游戏移植工具包(基于 Wine),旨在使开发者可以更简单和更快地将他们的 PC 游戏带到 macOS 上。以往,开发者想要让一款 PC 游戏在 Mac 上运行,需要花费数月的前期准备工作,而这个移植工具可以使开发者在短短几天内就看到现有的游戏在 M...
- 下一篇
JDK 21 从主线 fork ,成为下一个 Java LTS 版本
JDK 21 已进入 Rampdown 第一阶段,正式从主线 fork 出来,这是继 JDK 17 之后的又一 LTS 版本。 进入 Rampdown 第一阶段后,整个功能集被冻结。除了一个正在运行的 JEP 将被丢弃之外,此版本将不再针对 JEP 进行改动,而是专注于错误修复和其他已批准的增强功能。 JDK 21 版本共有 15 个 JEP ,是 JDK 20 的两倍有余。此版本带来了稳定版的虚拟线程功能、预览形式的字符串模板、Java 外部函数和内存 API 的第三预览版、Java Vector API 工的最新迭代,以及预览形式的结构化并发等内容。 新功能则包括密钥封装机制 APIKey Encapsulation Mechanism API、Z 垃圾收集器的分代行为Generational ZGC、序列化集合Sequenced Collections,以及努力简化 Hello World 写法的JEP 445...(关于 JEP 445 的详情可查看该文章:JAVA 新提案:努力简化 Hello World 写法) JDK 21 的初始候选版本将于 8 月发布,第二个候选版本将...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8安装Docker,最新的服务器搭配容器使用
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8编译安装MySQL8.0.19