RWKV 通过几万 token 的 CoT 解决几乎 100% 的数独问题
RWKV 做 CoT 特别有优势,因为推理速度和显存占用与上下文无关。即使做几百万 token 的 CoT 也不会变慢或额外消耗显存。
RWKV 社区开发者 @Jellyfish042 训练了一个用于解决数独谜题 的专用 RWKV 模型 Sudoku-RWKV ,项目的训练代码 和数据制作脚本均已开源。
GitHub 仓库:https://github.com/Jellyfish042/Sudoku-RWKV
Sudoku-RWKV 使用 700k 条数独专用的 COT 数据进行训练,数据总量约 25B(250 亿) token。这些数据均使用仓库内的 generate_sudoku_data.py
脚本自动生成。
100% 准确率
在 Jellyfish042 的测试中,Sudoku-RWKV 对最高 50 个空单元格的数独实现了 100% 的准确率。
高达 50 个空单元格的数独,解题难度会呈指数上升,而 RWKV 模型通过几万个 token 的 CoT 仍然可以实现近乎 100% 的解题率。
什么是数独
数独是一种逻辑游戏,玩家需要根据 9×9 盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含 1-9,不重复。
加入 RWKV 社区
RWKV 是一种创新的深度学习网络架构,它将 Transformer 与 RNN 各自的优点相结合,同时实现高度并行化训练与高效推理。
- RWKV 中文官网(有多篇多模态论文):https://rwkv.cn/
- RWKV-5/6(Eagle & Finch)论文: https://arxiv.org/abs/2404.05892
- RWKV-4 论文: https://arxiv.org/abs/2305.13048
欢迎大家加入 RWKV 社区!可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
黑莓 QNX 系统现在可免费用于非商业用途
黑莓宣布 QNX 现可免费用于非商业用途,并发布了可在 Raspberry Pi 4 计算机上运行的 QNX 8.0 映像。以及在 GitLab和GitHub上提供了相关的开源演示程序、应用程序、框架和库。 “感谢您对 QNX 软件开发平台 8.0 的关注。无论您是业余爱好者、学生还是行业专业人士,您现在都可以获得免费的 QNX SDP 8.0 许可,供您个人非商业使用。” 此举是黑莓QNX Everywhere的推广计划的一部分,该计划旨在扩展 QNX 的市场并吸引更多的开发人员使用该平台。在推出此次的无限制版本之前,该公司已经试水过了 30 天的免费评估版。 QNX 是黑莓公司旗下的类 Unix 实时操作系统,可追溯至 20 世纪 80 年代;最初由加拿大公司 Quantum Software Systems 开发。2004 年,音响设备制造商Harman International Industries以 1.38 亿美元的现金收购了该公司,2010 年又将其转手卖给了黑莓手机制造商 RIM。 目前,QNX在汽车系统中应用最为广泛,黑莓透露其已经搭载在全球超过 2.55 亿辆汽车...
- 下一篇
谷歌开源诺奖化学模型 Alphafold-3
谷歌终于开源了万众期待的蛋白质预测模型——AlphaFold-3。上个月,谷歌DeepMind联合创始人兼首席执行官Demis Hassabis能拿下诺贝尔化学奖,靠的就是AlphaFold-3。 全球顶级科学期刊《Nature》也进行了重磅推荐,这将对全球科研领域产生重大影响,生物、化学、医药的科学家们可以在本地部署AlphaFold-3,可以极限缩短新药、疫苗等研发进程。 谷歌本次开源AlphaFold-3模型非常非常低调,甚至都没有发布一篇新闻,只是在原来文章上进行了一段很小的文字说明: 2024年11月11日更新,我们已发布了AlphaFold 3的模型代码和权重供学术用途,以帮助推动科学研究。 AlphaFold-3的主要功能包括,能够对多种生物分子的结构进行预测,涵盖蛋白质、核酸(包括 DNA 和 RNA)、小分子、离子以及修饰残基等几乎所有在蛋白质数据库(PDB)中存在的分子类型。 在蛋白质结构预测方面,AlphaFold 3 展现出了极高的准确率,在预测蛋白质单体结构时,能够准确地确定蛋白质的三维折叠方式,包括二级结构α - 螺旋、β - 折叠等精确位置和走向,以及三级...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G