RWKV-7-World-0.1B 发布，RWKV-6-32B-Instruct 由海外社区发布-低调大师

RWKV-7-World-0.1B 发布，RWKV-6-32B-Instruct 由海外社区发布

2024-12-12 263

2024 年 12 月 11 日，RWKV 基金会正式发布了首款 RWKV-7 架构模型：RWKV-7-World-0.1B-v2.8。

同日，RWKV 海外社区团队发布了 QRWKV6-32B-Instruct-Preview-v0.1 模型，这是迄今最大规模的 RWKV 模型，且训练成本极低，仅需在 16 张显卡训练 8 小时。

关于 RWKV-7-World-0.1B

RWKV-7-World-0.1B-v2.8 是 RWKV-7-World 系列的首个模型。由于参数量较小，RWKV-7-World-0.1B 从 World v3 数据集（共 3.1T 数据）中随机采样了 1T 训练数据，并为其命名为 World v2.8 训练数据集。

RWKV-7-World-0.1B-v2.8 是目前全球最强的 0.1B 多语言模型。

在英文和多语言基准评测中，RWKV-7-World-0.1B 的英文能力一流，且多语言能力显著超越所有同尺寸模型。

此外，RWKV-7-World-0.1B 拥有优秀的 ReCORD 评分，这是长文本材料问答任务，表明 RWKV-7 模型能够更好地理解和使用长文本的信息。

在模型设计上，RWKV-7-World-0.1B-v2.8 模型保持 L12-D768，而非 SmolLM2 那种 L30-D576 尺寸。更少的神经网络层数（L12）使得 RWKV-7 的速度更快，更适合边缘设备等资源受限的推理场景，微调训练所需的数据和计算资源也更低。

更大规模的 RWKV-7-World 0.4B、1.5B、3B 也在训练中。

下载与体验

RWKV-7-World-0.1B 现已上传到 Hugging Face 和 ModelScope，可以从以下仓库下载：

HF 主站：https://huggingface.co/BlinkDL/rwkv-7-world
HF 镜像站：https://hf-mirror.com/BlinkDL/rwkv-7-world
ModelScope：https://modelscope.cn/models/Blink_DL/rwkv-7-world

由于 RWKV-7 架构更新了推理逻辑和代码，部分 RWKV 推理工具尚不支持 RWKV-7 模型。

截至 2024.12.12，RWKV pip 包 0.8.28 版本和 Ai00 0.5.11 版本已支持 RWKV-7 模型的推理。

关于 QRWKV6-32B-Instruct 模型

QRWKV6-32B-Instruct 由 RWKV 海外社区完成训练并发布。

QRWKV6-32B-Instruct 是使用 RWKV-V6 替换 Qwen-32B-Instruct 的 Transformer 注意力头，再使用少量数据训练，就能使它具有 RWKV 的效率和显存优势，克服原有的 Transformer 架构限制。

QRWKV6-32B-Instruct 的训练在 16 张 AMD MI300X GPU 上运行，总耗时仅需 8 小时。这些 MI300X 算力均由 TensorWave 赞助。

在多个基准测试中，QRWKV6-32B-Instruct 与 Qwen2.5-32B-Instruct 互有胜负。这里的训练只使用了几个 G 数据，在增大数据量后还会进一步显著提升。

将 Transformer 的 QKV Attention 迁移到 RWKV 模型，可以大幅降低大规模推理计算成本，且证明 RWKV 的架构非常适用于更大参数的模型。

更强的 RWKV7-32B-Instruct 和 70B 版本也即将发布。

下载和体验

QRWKV6-32B-Instruct 现已上传到 Hugging Face 仓库： recursal/QRWKV6-32B-Instruct-Preview-v0.1 。

在线体验：https://featherless.ai/models/recursal/QRWKV6-32B-Instruct-Preview-v0.1

微信关注我们

原文链接：https://www.oschina.net/news/324668

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

能不能用 uni-app 开发一个程序员社区 APP？

在移动开发领域，uni-app 以其强大的跨平台能力和高效的开发体验，正逐渐成为众多开发者的首选。那么，对于程序员社区 APP、小程序这样的项目，uni-app 是否胜任呢？答案是肯定的，开源中国新版 APP 就是用 uni-app 开发的。 uni-app 的亮点与局限优点：跨平台高效：uni-app 基于 Vue.js，支持一次编写，多端发布，包括 iOS、Android、H5 及各大小程序平台，显著降低开发成本。组件丰富：提供大量内置组件和 API，加速开发进程，同时支持自定义组件，提升应用功能。性能优化：通过编译转换，uni-app 能充分利用原生渲染，保证应用流畅性。局限：平台特性受限：跨平台特性可能导致无法完全利用特定平台功能。复杂场景性能挑战：在高图形需求或复杂交互中，性能可能略逊于原生应用。总体而言，uni-app 的优势远大于劣势，是构建多平台应用的理想选择。对于程序员而言，uni-app 不仅降低了开发成本，还提高了开发效率。它允许程序员使用熟悉的 Vue.js 语法，快速构建出功能丰富、性能优越的应用。此外...

2024-12-12

270

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。 # 2024.12.12 今日要闻小米物联网操作系统 Vela 正式开源，代码已托管至 Gitee/GitHub OpenVela 操作系统专为 AIoT 领域量身定制，以轻量化、标准兼容、安全性和高度可扩展性为核心特点。目前已被用于众多物联网设备和 AI 硬件，涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。 Xiaomi Vela 是小米基于开源实时操作系统 NuttX 打造的物联网嵌入式软件平台，Vela 在各种物联网硬件平台上提供统一的软件服务，适配多种不同硬件规格的产品，最小系统仅需 8KB 内存，CPU 主频不限，适配任意 SoC 多核架构，支持柔性部署，支持丰富的组件和易用的框架，打通碎片化的物联网应用场景。 OpenVela 和 Xiaomi Vela 基于同一套代码实现，OpenVela是开源版本。清华大学计算机教授、《数据结构》编著者严蔚敏去世，享年 86 岁清华大学计算机教授马少平在社交平台发布了严蔚敏教授的去世消息。谷歌发布新一代大模型 Gemini 2.0 谷...

2024-12-12

264

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。