RWKV7-G1a 1.5B 开源发布,新推理风格和长度控制,效果显著增强
2025 年 9 月 22 日, RWKV7-G1a 1.5B 推理模型(Reasoning Model)正式开源发布。
RWKV7-G1a 1.5B 从 RWKV7-G1 1.5B 继续训练 1T 高质量数据,显著提升模型能力,且加入新的推理风格,可设置推理长度。
模型客观指标评测
英语和多语言能力
RWKV7-G1a 1.5B 的基础英语和多语言能力均强于同规模的开源模型:
RWKV7-G1a 1.5B 的 MMLU 为 50.2%(RWKV7-G1 1.5B 为 48.2%)。注意这是没有使用任何 mid-training 和 post-training 的真实基底模型成绩。
我们正在训练 RWKV7-G0 13.3B,在训练 63% 时 MMLU 已达 71.4%。预计十月发布。
无法作弊的评测
Uncheatable Eval 是"无法作弊的评测",它使用最新的论文/新闻/代码/小说等实时数据,测试压缩率("压缩即智能"),评估基底语言模型的真实语言建模能力和泛化能力。
RWKV7-G1a 1.5B 的 Uncheatable Eval 显著提升,已非常接近 1.7B 参数的 Qwen3-1.7B-Base。
多种推理风格
RWKV7-G1a 1.5B 加入了一种新推理风格,通过在问题后加入【 think】引导。
新推理风格
新推理风格的提示词格式:
User: USER_PROMPT think
Assistant: <think
注意在 USER_PROMPT 后的【 think】和前文之间必须有恰好一个空格。如果不添加【 think】,模型会以默认推理风格进行思考。
下面是 RWKV7-G1a 1.5B 使用新推理风格的效果,注意此时它会使用英语思考:
-
非技术问题
-
技术问题
新推理风格,短思考
通过【 think a bit】可缩短新推理风格的思考长度。提示词格式:
User: USER_PROMPT think a bit
Assistant: <think
-
非技术问题
-
技术问题
新推理风格,长思考
通过【 think a lot】可增加新推理风格的思考长度。提示词格式:
User: USER_PROMPT think a lot
Assistant: <think
-
非技术问题
-
技术问题
这里的新推理风格和长度控制,仅适用于 2025 年 9 月 22 日及之后发布的 RWKV7-G 系列模型(从 RWKV7-G1a 1.5B 开始)。我们会陆续升级各个尺寸的模型。例如,几天后发布 RWKV7-G1a 2.9B。
"假"思考模式
最后,对于所有 RWKV7-G 系列模型,通过在提示中加入空 think
标签,可以模拟一个"已完成思考"的上下文,引导模型生成有结构和逻辑的回复。
提示词格式:
User: USER_PROMPT
Assistant: <think>
</think
-
非技术问题
-
技术问题
解码参数推荐
RWKV 的运行工具均支持调整模型的解码参数,您可以调整解码参数适应不同任务的特点。
下面是推荐的解码参数:
模式 | Temp |
Top-p |
Presence Penalty |
Frequency Penalty |
Penalty Decay |
主要特点与适用场景 |
---|---|---|---|---|---|---|
默认 | 1.0 | 0.3 | 0.5 | 0.5 | 0.996 | 默认的推荐解码参数 |
综合 | 1.0 | 0.3 | 2 | 0.2 | 0.99 | 另一种推荐解码参数 |
创意 | 0.6 | 0.6 ~ 0.8 | 2 | 0.2 | 0.99 | 思维发散,想象力强 |
保守 | 0.3 | 0.3 | 0 | 0 | 0.99 | 适合数学和机械任务 |
固定 | 0.2 | 0 | 0 | 0 | 0.99 | 最保守的输出 |
如果你对这些解码参数的含义不熟悉,可以参考 RWKV 官网关于解码参数的文档:RWKV 的解码参数
模型下载
下载 RWKV7-G1a 1.5B 模型:
- Hugging Face:https://huggingface.co/BlinkDL/rwkv7-g1/tree/main
- 魔搭社区:https://modelscope.cn/models/RWKV/rwkv7-g1/files
- WiseModel:https://wisemodel.cn/models/rwkv4fun/RWKV-7-G1/file
如何使用 RWKV 模型
可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。
此外,RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。
由于 RWKV7-G1a 1.5B 是新模型,目前建议使用 RWKV Runner 以保证得到正确结果。
可以在 RWKV 官网 - 模型推理教程中查看上述推理工具的使用教程。
加入 RWKV 社区
欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。
- 📖 RWKV 中文文档:https://www.rwkv.cn
- 💬 RWKV 论坛:https://community.rwkv.cn/
- 🐧 QQ 频道:https://pd.qq.com/s/9n21eravc | QQ 交流群:224287095
- 📺 BiliBili 视频教程:https://space.bilibili.com/3546689096910933
欢迎大家基于 RWKV-7 进行创业、科研,我们也会为基于 RWKV 的项目提供技术支持。
如果您的团队正在基于 RWKV 创业或开展研究,请联系我们!(在"RWKV元始智能"微信公众号留言您的联系方式,或发送邮件到"contact@rwkvos.com"。)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
【直播预告】共建场景能力,赋能鸿蒙商业级应用开发
随着鸿蒙生态的蓬勃发展,如何充分利用其优势开发出更具竞争力的商业级应用,成为开发者们关注的焦点。本次直播将聚焦“共建场景能力,赋能鸿蒙商业级应用开发”,邀请两位华为HDE专家深度分享实战经验,助力开发者掌握鸿蒙应用开发精髓。 嘉宾阵容强大,实战经验倾囊相授 👏陈政(三掌柜)——社交应用巧借鸿蒙特性破圈 作为华为HDE、HCDE,鸿蒙公益布道师,三掌柜将结合社交应用场景,分享如何巧妙利用开源组件实现高效开发: 大图预览:提升用户黏性的实用技巧 多尺寸图片展示:应对鸿蒙特有服务组件的创新方案 工具组件库:实用工具助力高效开发 实际使用经验分享:避开开发陷阱,直击核心要点 展望未来:洞察鸿蒙社交应用发展新趋势 👏吴盼盼——鸿蒙开源组件赋能金融应用实践 华为HDE、华为HDG组织者吴盼盼将聚焦金融行业,分享开源组件在实际业务中的应用: 极速弹窗的高效使用:提升用户体验的关键技术 日历组件快速集成:简化开发流程的实用方案 难题破解之道:金融应用开发中的典型问题解决方案 开发经验分享:从0到1的完整实践心得 总结与展望:金融应用在鸿蒙生态的发展前景 鸿蒙生态建设正当时,掌握核心开发能力,抢占市...
-
下一篇
GreatSQL 优化技巧:最值子查询与窗口函数相互转换
GreatSQL 优化技巧:最值子查询与窗口函数相互转换 导语 近期 SQL 优化过程中遇到两个案例,一个是将最值子查询改写为窗口函数,另一个是将窗口函数改写为最值子查询,觉得很有意思,特此记录分享一下。 SQL案例 两个 SQL 语句 SQL1: SELECT imei, c1 FROM (SELECT imei, c1, row_number() OVER(PARTITION BY imei ORDER BY statistic_time DESC) AS rn FROM t1) WHERE rn = 1; SQL2: SELECT * FROM t1 a WHERE to_char(statistic_time, 'yyyymmdd') = (SELECT MAX(to_char(statistic_time, 'yyyymmdd')) FROM t1 b WHERE a.c2 = b.c2 ) AND a.imei = 'a'; 这两个语句的真实场景并不是在一个系统中遇到的,这里只是用一张测试表来说明这两个 SQL 的问题。 测试表与测试数据如下: CREATE TABLE t...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Windows10,CentOS7,CentOS8安装Nodejs环境
- 2048小游戏-低调大师作品