RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
2025 年 9 月 24 日, RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力。
RWKV7-G1a 2.9B 从 RWKV7-G1 2.9B 继续训练 1T tokens 高质量数据,显著提升各方面能力。
模型客观指标评测
英语和多语言能力
RWKV7-G1a 2.9B 的基础英语和多语言能力均强于同规模的开源模型:
作为纯预训练的基底模型,无“刷榜”,RWKV7-G1a 2.9B 的 MMLU 提升到 61.1%,MMLU Pro 提升到 31.5%(RWKV7-G1 2.9B 的 MMLU 为 58.0%,MMLU Pro 为 25.8%)。
无法作弊的评测
Uncheatable Eval 是"无法作弊的评测",它使用最新的论文/新闻/代码/小说等实时数据,测试压缩率(“压缩即智能”),评估基底语言模型的真实语言建模能力和泛化能力。
RWKV7-G1a 2.9B 的 Uncheatable Eval 继续提升,领先所有 3B 参数量开源模型。
模型实战
多语言能力
翻译问题推荐使用保守的解码参数,此处为:temp=0.2,topp=0.2,presence=0,frequency=0,decay=0.996
RWKV7-G1a 2.9B 同时做多语言翻译:
代码
代码问题推荐使用保守的解码参数,此处为:temp=0.3,topp=0.3,presence=0,frequency=0,decay=0.996
求解最长公共子序列:
设计 LRU 缓存:
数学
数学问题推荐使用保守的解码参数,此处为:temp=0.3,topp=0.3,presence=0,frequency=0,decay=0.996
抛物线问题:
多项式问题:
物理
物理问题推荐使用保守的解码参数,此处为:temp=0.3,topp=0.3,presence=0,frequency=0,decay=0.996
计算火星的重力加速度:
创作
创作问题推荐使用开放的解码参数,此处为:temp=0.6,topp=0.7,presence=2,frequency=0.2,decay=0.99(注意是0.99)
古诗创作:
模型下载
下载 RWKV7-G1a 2.9B 模型:
- Hugging Face:https://huggingface.co/BlinkDL/rwkv7-g1/tree/main
- 魔搭社区:https://modelscope.cn/models/RWKV/rwkv7-g1/files
- WiseModel:https://wisemodel.cn/models/rwkv4fun/RWKV-7-G1/file
如何使用 RWKV 模型
我们提供了多个 RWKV-7 模型的在线 demo,也提供本地部署的教程。
在线 demo(聊天模式)
为了方便社区体验 RWKV-G1a 模型,我们提供了聊天模式的在线 demo。
- Hugging Face:https://huggingface.co/spaces/RWKV-Red-Team/RWKV-LatestSpace(已更新到 G1a 模型)
- 魔搭 demo:https://modelscope.cn/studios/RWKV-Red-Team/RWKV-LatestSpace/summary(请等待更新到 G1a 模型)
这个 RWKV 对话界面由 RWKV 社区成员 @Leon 开发,并在 GitHub 仓库 web-rwkv-realweb 中开源。
在线 demo(续写模式)
可以在 RWKV 官方 Demo 中试用 RWKV7-G1a 2.9B 模型:
- **Hugging Face Gradio Demo:**https://huggingface.co/spaces/BlinkDL/RWKV-Gradio-2
RWKV7-G1a 2.9B 也支持另一种推理风格(支持长度控制),见:RWKV7-G1a 1.5B 开源发布,新推理风格和长度控制,效果显著增强
本地部署
可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。
此外,RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。
由于 RWKV7-G1a 2.9B 是新模型,目前建议使用 RWKV Runner 以保证得到正确结果。
可以在 RWKV 官网 - 模型推理教程中查看上述推理工具的使用教程。
加入 RWKV 社区
欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。
- 📖 RWKV 中文文档:https://www.rwkv.cn
- 💬 RWKV 论坛:https://community.rwkv.cn/
- 🐧 QQ 频道:https://pd.qq.com/s/9n21eravc
- 📺 BiliBili 视频教程:https://space.bilibili.com/3546689096910933
欢迎大家基于 RWKV-7 进行创业、科研,我们也会为基于 RWKV 的项目提供技术支持。
如果您的团队正在基于 RWKV 创业或开展研究,请联系我们!(在“RWKV元始智能”微信公众号留言您的联系方式,或发送邮件到“contact@rwkvos.com”。)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Typing Word - 单词与文章练习工具
学习英语,一次敲击,一点进步;记忆不再盲目,学习更高效,开源单词与文章练习工具。 功能列表 单词练习 三种输入模式:跟打 / 复习 / 默写 智能模式:记忆曲线自动计算学习单词,并通过默写加深记忆 自由模式:不受限制,自行规划 提供音标、发音(美音、英音)、例句、短语、近义词、同根词、词源、错误统计等功能 背文章 内置经典教材书籍,也可自行添加、导入文章,提供一键翻译、译文对照功能 跟打 + 默写双模式,逐句输入,自动发音,让背诵更高效 支持边听边默写,强化记忆 收藏、错词本、已掌握 学习单词时输入错误自动添加到错词本,方便后续复习 可主动添加到已掌握,后续学习时自动跳过 可主动添加到收藏中,以便巩固复习 高度自由 丰富的键盘音效 可自定义快捷键 高度定制化的设置选项 简洁高效 简洁设计,现代化UI,无广告 界面清爽,操作简单 不强制关注任何平台 词库 内置了常用的 CET-4 、CET-6 、GMAT 、GRE 、IELTS 、SAT 、TOEFL 、考研英语、专业四级英语、专业八级英语等词库。
-
下一篇
DeepSeek 拥抱国产 GPU 编程语言 TileLang
9 月 29 日,深度求索正式发布DeepSeek V3.2-Exp 模型(实验性版本),大幅提升了长文本处理效率,并宣布 API 调用成本降低 50% 以上。在这篇公告中,有这样一段表述: 在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。我们使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。 据介绍,TileLang 是一种简洁的领域专用语言(DSL),旨在简化 GPU 和 NPU 等加速器上的算子编程,其核心设计理念是将复杂的硬件调度与开发者的算法逻辑解耦。 TileLang 由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智。 https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519 Tilelang 主要技术亮点包括: 简化 NPU 算子编程复杂度:Tilelang 采用类 Python 语法,大大降低 NPU 算子开发门槛,封装调度空间为自定义原语,开发者更加关注数据流本身。 支持灵活扩展:实现调度空间与数据流解耦...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 面试大杂烩