RWKV-6-Finch 3B 模型于 2 月 29 日开源-低调大师

RWKV-6-Finch 3B 模型于 2 月 29 日开源

2024-03-04 410

2024 年 2 月 29 日，经过密集的精心训练与严格的测试验证，RWKV 开源基金会宣布其划时代的 RWKV-6-Finch 3B 模型正式向全球开源。

本次开源的 RWKV-6-Finch 3B 模型，为 RWKV 第六代架构中的 3B 参数级大型语言模型。与前代 RWKV-5 相比较，RWKV-6 不仅在多语言处理能力上实现了革命性的飞跃，其在角色扮演等领域的表现也格外出色，显著超越以往所有模型。

图：RWKV-6-Finch 3B 扮演一位炼金术士

迭代后的 RWKV-6 已在效果、计算效率、能耗上领先于 Transformer 同参数模型，彰显了其领先技术的卓越成就。

我们将继续在 World-2.1（1.4T）上训练 RWKV-6 模型，以提高性能。更加强大的 RWKV-6.1 版本将于两个月后面世，期待与大家共同见证。

评测数据

本次评测涵盖了 14 款接近 3B 参数规模的开源大语言模型，其中不乏 RWKV 系列中的前代佳作，如 RWKV-4 和 RWKV-5。

其中，英语的性能测试将通过 12 个独立的基准测试来衡量大模型在常识推理和世界知识等英语内容上的表现。而多语言能力的评估中，则采用了 xLAMBDA、xStoryCloze、 xWinograd 和 xCopa 四种基准测试，深度探索了评估模型在多语言环境中的逻辑推理、故事理解、歧义解决和因果推理能力。

图：14 款 3B 参数模型基准测试结果

测试结果印证了 RWKV-6-Finch 3B 在英语和多语言测试中的卓越表现，相较于同规模的 RWKV-v5 模型，展现了显著的进步。

在多语言能力的评估中，RWKV-6-Finch 3B 以 58.9% 的高分领跑，不仅超越了其他参评模型，甚至略胜于 Mistral 7B 的 58.2% 。

模型试玩 & 下载

在线 Demo：https://huggingface.co/spaces/BlinkDL/RWKV-Gradio-1

下载地址：https://huggingface.co/BlinkDL/rwkv-6-world/blob/main/RWKV-x060-World-3B-v2-20240228-ctx4096.pth

💡由于 Hugging Face 的在线 Demo 是续写模式，如果你在 RWKV-Gradio-1 中体验 RWKV-6 Finch 3B 模型，我们建议您按以下两种格式输入提示词（prompts） :

User: hi
Assistant: Hi. I am your assistant and I will provide expert full response in full details. Please feel free to ask any question and I will always answer it.
User: (你的问题，比如“请为我推荐三本适合五岁小孩阅读的世界名著” )
Assistant:

运行效果：

2

Instruction: （你希望模型进行什么操作，比如“请将下列瑞典语翻译成中文”）
Input:（你希望模型处理哪些内容，比如“hur l?ng tid tog det att bygga twin towers”）
Response:

运行效果：

RWKV 模型介绍

RWKV 是一种创新的深度学习网络架构，它将 Transformer 与 RNN 各自的优点相结合，同时实现高度并行化训练与高效推理，时间复杂度为线性复杂度，在长序列推理场景下具有优于 Transformer 的性能潜力。

我们的最新版本是 RWKV V6 ，架构图如下：

图：RWKV V6 架构

相对 Transformer 架构，RWKV 架构的推理成本降低 2~10 倍，训练成本降低 2~3 倍。

RWKV 模型最初由彭博设计，主要算力由 Stability AI 和 AI Eleuther 等机构捐赠。如今，RWKV 已捐赠给 Linux Foundation AI&Data 作为孵化项目。

微信关注我们

原文链接：https://www.oschina.net/news/281454

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【比较mybatis、lazy、sqltoy、mybatis-flex、easy-query】（三）

orm框架使用性能比较比较mybatis、lazy、sqltoy、mybatis-flex、easy-query操作数据环境： idea jdk17 spring boot 3.0.7 mysql 8.0 测试条件常规对象 orm 框架是否支持xml 是否支持 Lambda 对比版本 mybatis ☑️ ☑️ 3.5.4 sqltoy ☑️ ☑️ 5.2.98 lazy ✖️ ☑️ 1.2.4-JDK17-SNAPSHOT mybatis-flex ☑️ ☑️ 1.8.0 easy-query ✖️ ☑️ 1.10.31 数据库表(含有唯一性索引s_u) CREATE TABLE `sys_user` ( `column_name` varchar(255) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '额外字段', `create_time` datetime DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '创建时间', ...

2024-03-04

342

引言 Redis是一款基于键值对的数据结构存储系统，它的特点是基于内存操作、单线程处理命令、IO多路复用模型处理网络请求、键值对存储与简单丰富的数据结构等等这篇文章主要围绕Redis中的对象与数据结构来详细说明键值对存储与简单丰富的数据结构这两大特点 Redis中的数据以Key,Value键值对的形式存储在字典中，字典的实现是哈希表键Key只能使用字符串对象来表示，值Value能够使用其他所有对象对象与数据结构 Redis中存在丰富的对象，常用的对象（数据类型）有字符串对象string、列表对象list、散列对象hash、集合对象set、有序集合对象zset等还有其他的数据类型如Bitmap、Hyperloglog、Geospatial、布隆过滤器等，但这篇文章只涉及常用的对象，其他数据类型再以后的文章中再展开说明 redis中的对象RedisObject由类型、编码、引用次数、lru、指向编码使用的数据结构对象构成类型标识这个对象是什么类型对象比如字符串、列表、哈希、集合、有序集合等编码表示构成对应类型对象时使用哪种数据结构引用次数表示这个对象被引用了多少次 redi...

2024-03-02

323

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。