RWKV7-G1a 1.5B 开源发布，新推理风格和长度控制，效果显著增强-低调大师

RWKV7-G1a 1.5B 开源发布，新推理风格和长度控制，效果显著增强

2025-09-25 81

2025 年 9 月 22 日， RWKV7-G1a 1.5B 推理模型（Reasoning Model）正式开源发布。

RWKV7-G1a 1.5B 从 RWKV7-G1 1.5B 继续训练 1T 高质量数据，显著提升模型能力，且加入新的推理风格，可设置推理长度。

模型客观指标评测

英语和多语言能力

RWKV7-G1a 1.5B 的基础英语和多语言能力均强于同规模的开源模型：

RWKV7-G1a 1.5B 的 MMLU 为 50.2%（RWKV7-G1 1.5B 为 48.2%）。注意这是没有使用任何 mid-training 和 post-training 的真实基底模型成绩。

我们正在训练 RWKV7-G0 13.3B，在训练 63% 时 MMLU 已达 71.4%。预计十月发布。

无法作弊的评测

Uncheatable Eval 是"无法作弊的评测"，它使用最新的论文/新闻/代码/小说等实时数据，测试压缩率（"压缩即智能"），评估基底语言模型的真实语言建模能力和泛化能力。

RWKV7-G1a 1.5B 的 Uncheatable Eval 显著提升，已非常接近 1.7B 参数的 Qwen3-1.7B-Base。

多种推理风格

RWKV7-G1a 1.5B 加入了一种新推理风格，通过在问题后加入【 think】引导。

新推理风格

新推理风格的提示词格式：

User: USER_PROMPT think

Assistant: <think

注意在 USER_PROMPT 后的【 think】和前文之间必须有恰好一个空格。如果不添加【 think】，模型会以默认推理风格进行思考。

下面是 RWKV7-G1a 1.5B 使用新推理风格的效果，注意此时它会使用英语思考：

非技术问题
技术问题

新推理风格，短思考

通过【 think a bit】可缩短新推理风格的思考长度。提示词格式：

User: USER_PROMPT think a bit

Assistant: <think

非技术问题
技术问题

新推理风格，长思考

通过【 think a lot】可增加新推理风格的思考长度。提示词格式：

User: USER_PROMPT think a lot

Assistant: <think

非技术问题
技术问题

这里的新推理风格和长度控制，仅适用于 2025 年 9 月 22 日及之后发布的 RWKV7-G 系列模型（从 RWKV7-G1a 1.5B 开始）。我们会陆续升级各个尺寸的模型。例如，几天后发布 RWKV7-G1a 2.9B。

"假"思考模式

最后，对于所有 RWKV7-G 系列模型，通过在提示中加入空 think 标签，可以模拟一个"已完成思考"的上下文，引导模型生成有结构和逻辑的回复。

提示词格式：

User: USER_PROMPT

Assistant: <think>
</think

非技术问题
技术问题

解码参数推荐

RWKV 的运行工具均支持调整模型的解码参数，您可以调整解码参数适应不同任务的特点。

下面是推荐的解码参数：

模式	`Temp`	`Top-p`	`Presence Penalty`	`Frequency Penalty`	`Penalty Decay`	主要特点与适用场景
默认	1.0	0.3	0.5	0.5	0.996	默认的推荐解码参数
综合	1.0	0.3	2	0.2	0.99	另一种推荐解码参数
创意	0.6	0.6 ~ 0.8	2	0.2	0.99	思维发散，想象力强
保守	0.3	0.3	0	0	0.99	适合数学和机械任务
固定	0.2	0	0	0	0.99	最保守的输出

如果你对这些解码参数的含义不熟悉，可以参考 RWKV 官网关于解码参数的文档：RWKV 的解码参数

模型下载

下载 RWKV7-G1a 1.5B 模型：

Hugging Face：https://huggingface.co/BlinkDL/rwkv7-g1/tree/main
魔搭社区：https://modelscope.cn/models/RWKV/rwkv7-g1/files
WiseModel：https://wisemodel.cn/models/rwkv4fun/RWKV-7-G1/file

如何使用 RWKV 模型

可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。

此外，RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。

由于 RWKV7-G1a 1.5B 是新模型，目前建议使用 RWKV Runner 以保证得到正确结果。

可以在 RWKV 官网 - 模型推理教程中查看上述推理工具的使用教程。

加入 RWKV 社区

欢迎大家加入 RWKV 社区，可以从 RWKV 中文官网了解 RWKV 模型，也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊，一起探讨 RWKV 模型。

📖 RWKV 中文文档：https://www.rwkv.cn
💬 RWKV 论坛：https://community.rwkv.cn/
🐧 QQ 频道：https://pd.qq.com/s/9n21eravc | QQ 交流群：224287095
📺 BiliBili 视频教程：https://space.bilibili.com/3546689096910933

欢迎大家基于 RWKV-7 进行创业、科研，我们也会为基于 RWKV 的项目提供技术支持。

如果您的团队正在基于 RWKV 创业或开展研究，请联系我们！（在"RWKV元始智能"微信公众号留言您的联系方式，或发送邮件到"contact@rwkvos.com"。）

微信关注我们

原文链接：https://my.oschina.net/u/7093160/blog/18693338

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【直播预告】共建场景能力，赋能鸿蒙商业级应用开发

随着鸿蒙生态的蓬勃发展，如何充分利用其优势开发出更具竞争力的商业级应用，成为开发者们关注的焦点。本次直播将聚焦“共建场景能力，赋能鸿蒙商业级应用开发”，邀请两位华为HDE专家深度分享实战经验，助力开发者掌握鸿蒙应用开发精髓。嘉宾阵容强大，实战经验倾囊相授 👏陈政（三掌柜）——社交应用巧借鸿蒙特性破圈作为华为HDE、HCDE，鸿蒙公益布道师，三掌柜将结合社交应用场景，分享如何巧妙利用开源组件实现高效开发：大图预览：提升用户黏性的实用技巧多尺寸图片展示：应对鸿蒙特有服务组件的创新方案工具组件库：实用工具助力高效开发实际使用经验分享：避开开发陷阱，直击核心要点展望未来：洞察鸿蒙社交应用发展新趋势 👏吴盼盼——鸿蒙开源组件赋能金融应用实践华为HDE、华为HDG组织者吴盼盼将聚焦金融行业，分享开源组件在实际业务中的应用：极速弹窗的高效使用：提升用户体验的关键技术日历组件快速集成：简化开发流程的实用方案难题破解之道：金融应用开发中的典型问题解决方案开发经验分享：从0到1的完整实践心得总结与展望：金融应用在鸿蒙生态的发展前景鸿蒙生态建设正当时，掌握核心开发能力，抢占市...

2025-09-25

99

GreatSQL 优化技巧：最值子查询与窗口函数相互转换导语近期 SQL 优化过程中遇到两个案例，一个是将最值子查询改写为窗口函数，另一个是将窗口函数改写为最值子查询，觉得很有意思，特此记录分享一下。 SQL案例两个 SQL 语句 SQL1： SELECT imei, c1 FROM (SELECT imei, c1, row_number() OVER(PARTITION BY imei ORDER BY statistic_time DESC) AS rn FROM t1) WHERE rn = 1; SQL2： SELECT * FROM t1 a WHERE to_char(statistic_time, 'yyyymmdd') = (SELECT MAX(to_char(statistic_time, 'yyyymmdd')) FROM t1 b WHERE a.c2 = b.c2 ) AND a.imei = 'a'; 这两个语句的真实场景并不是在一个系统中遇到的，这里只是用一张测试表来说明这两个 SQL 的问题。测试表与测试数据如下： CREATE TABLE t...

2025-09-26

60

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Apache Tomcat

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

JDK

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。