State 微调、PointRWKV、中文文档上线……RWKV 社区 5 月最新动态来啦！-低调大师

State 微调、PointRWKV、中文文档上线……RWKV 社区 5 月最新动态来啦！

2024-05-31 376

大家好，这里是我们组织的新栏目：RWKV 社区最新动态，这个栏目会不定期播报 RWKV 社区的最新消息，以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。

《RWKV 社区最新动态》是不定期更新，所以请保持关注我们的公众号（RWKV 元始智能）、QQ 频道（RWKV）等公开的消息平台，以获取最新的消息。

本期节目统计了 RWKV 社区 5 月的重要动态：

RWKV 中文文档（测试版）已上线

RWKV 中文文档 https://rwkv.cn/docs 已上线。

当前文档涵盖了 RWKV 百科、RWKV 模型微调、RWKV 本地部署和推理工具 RWKV Runner 和 Ai00 的使用教程。

RWKV 中文文档处于测试阶段，后续会继续完善内容并更新视觉风格，欢迎大家对文档提出改进意见。

寻找基于 RWKV 的项目

RWKV Foundation 想感谢大家对 RWKV 大模型的支持。我们特别准备了一些周边礼品，作为小小心意~

如果你曾经或正在使用 RWKV 大模型进行开源或商业项目的开发，请与我们联系！

（可以在下方留言或私信我们的微信公众号，告诉我们你的联系方式和项目信息。

RWKV 参加澳门 BEYOND EXPO

5 月 23 - 25 日，作为 NVIDIA Inception Program 成员之一， RWKV 受邀参加第四届 BEYOND 国际科技创新博览会（BEYOND Expo 2024），在大会现场中展示了 RWKV AI 作曲工具和 RWKV-6 7B 语言模型。

RWKV 作曲家兼顾生产力和趣味性，就连澳门特首都被动听的旋律吸引而来：

新微调方法：State tuning

RWKV 推出了新的微调方法：state tuning。

RWKV 是纯 RNN，因此可以做 transformer 难以做到的事情。例如，作为 RNN 有固定大小的 state，所以，微调 RWKV 的初始 state，就相当于最彻底的 prompt tuning，甚至可以用于 alignment，因为迁移能力很强。

目前 RWKV Runner 和 Ai00 等 RWKV 模型推理工具都已支持挂载 state tuning 训练得到的 state 文件。

注意：挂载 state 文件时，必须使用训练该 state 文件的同款 RWKV 模型。

举个例子：这个 state 文件是基于 RWKV-6-World-7B-v2.1 模型微调而来，那么你在 RWKV Runner 或 Ai00 等工具中必须启动 RWKV-6-World-7B-v2.1 模型，挂载的 state 文件才会生效。

我们正在准备 RWKV state tuning 的教程，很快会为大家呈现！

RWKV 的 MMLU 数据

社区开发者在 FP16 下测试了 RWKV-6-World-7B-v2.1 模型的 benchmark，得到以下数据：

MMLU 0-shot 42.88%
CMMLU 0-shot 39.84%
MMLU 5-shot 43.99%

作为对比， llama2 7B MMLU 数据为 45.3%。

RWKV 社区新项目/项目更新

新的多模态项目：PointRWKV

PointRWKV 项目是一种基于 RWKV 的 3D 点云学习框架，在下游点云任务上性能优于基于 Transformer 和 Mamba 的同类工作，显著节省了约 46% 的 FLOPS。

PointRWKV 项目由腾讯优图主导，计划逐步开源。

可以从下面的链接了解 PointRWKV ：

论文链接：https://arxiv.org/pdf/2405.15214 《PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning 》

仓库地址：https://github.com/hithqd/PointRWKV

新项目：RWKV_LM_EXT

RWKV_LM_EXT 旨在扩展 RWKV LM 的功能，包括序列分类/嵌入/peft/交叉编码器/双编码器/多模态等。

仓库地址：https://github.com/yynil/RWKV_LM_EXT

RWKV Runner 发布新版本

RWKV Runner 在 5 月发布了 v1.8.0 ~ v1.8.4 五个版本，其中需要注意的改进：

支持动态挂载 state 文件
修复了因 setuptools 更新引起的兼容性问题，如果你还出现仍然出现下图中的问题，请更新 runner 版本！

Ai00 发布新版本

RWKV Runner 在 5 月发布了 v0.4.7 ~ v0.5.1 五个版本，其中需要注意的改进：

支持动态挂载 state 文件和 LoRA 文件
支持 BNF (Backus-Naur Form) ，BNF 可以强制模型以您想要的格式输出（例如，JSON、带有指定字段的 markdown）
支持以 prefab 格式导出量化模型
新增 Ai00 在线文档：https://ai00-x.github.io/ai00_server/

Ai00 新功能的详情可以参考：https://ai00-x.github.io/ai00_server/doc-guide/features

RWKV-PEFT 发布新微调方法

RWKV-PEFT 是 RWKV 模型的微调仓库，包含 Pissa、Lisa、Lora、State tuning 等多种微调方法。

RWKV-PEFT 在 5 月更新了 infctx train、State tunin、FLA（Flash Linear Attention）等内容，更多细节可以在仓库中查看。

RWKV-PEFT 仓库地址：https://github.com/JL-er/RWKV-PEFT

6 月动态预告

RWKV-6 14B 即将发布

RWKV-6 14B 模型预计在 6 月中旬完成训练并开源发布。

RWKV 6 月线上分享会

6 月中旬我们将开展一场线上分享会，会上将包含 RWKV-6 架构，RWKV-TS、Vision RWKV、Diffusion RWKV、RWKV-ASR 等 RWKV 多模态的论文分享和解析。

会议还包含了 RWKV 答疑环节，如果你想在分享会上进一步了解 RWKV 的架构、多模态工作等生态内容，可以关注我们的官方频道，随时掌握线上分享会的动态！

微信关注我们

原文链接：https://www.oschina.net/news/295192

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Java 的 AI 前景光明

InfoWorld 特约编辑 Paul Krill 最近采访了 Azul 首席执行官 Scott Sellers，谈及 Java 在蓬勃发展的 AI 领域的地位以及在当今软件世界中的地位。Azul Systems 是一家专门提供 Java 技术的计算机软件开发公司，与Oracle 保持着竞争关系。当谈论 AI 时，最常被提及的编程语言往往是 Python。但 Scott 认为，Python 的地位并非不可撼动。“看看 Python 在 AI 中的应用，再看看它的作用，你会发现它就像胶水代码一样。其实 Python 本身做的事情并不多。它实际上主要是调用本地库或 GPU 库。接口才是关键所在。” 因此 Scott 断言，随着时间的推移，Java 在 AI 领域将可以和 Python 匹敌。“AI 越多地融入传统业务逻辑和那些需要在真正的应用程序级别发生的事情，就越能达到 Java 的 sweet spot，Java 的受欢迎程度就越高。而Python 在性能和规模等方面非常有限。” 目前的 Java 版本节奏是每六个月发布一次，同时将 Java 运行时和 Java 平台的快速发展与确定...

2024-05-31

345

如今的LLM应用具有多样化的时延要求。例如，聊天机器人可能需要快速的初始响应（例如，少于0.2秒），但在解码速度上只需要匹配人类阅读速度，而代码补全则需要快速的端到端生成时间，以实现实时代码建议。本文说明了优化吞吐量（throughput）的现有serving系统，在时延标准下并不是最优选择。作者主张使用有效吞吐量（goodput），即符合服务等级目标（SLO）的每秒完成请求数量，作为衡量LLM serving性能的改进指标，以考虑成本和用户满意度。为优化有效吞吐量，作者引入了预填充-解码解耦（prefill-decode disaggregation），也就是将预填充从解码中分离到不同的GPU。他们还构建了一个系统原型DistServe，能够实现高达4.48倍的吞吐量或SLO严格（tighter）10.2倍，同时保持在严格的时延约束内。DistServe正在集成到vLLM中。（以下内容由OneFlow编译发布，转载请联系授权。原文：https://hao-ai-lab.github.io/blogs/distserve/）作者|Yinmin Zhong, Junda Chen...

2024-05-31

423

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。