RWKV-7 预览版、大量新论文...RWKV 社区 9 月动态速览!
欢迎大家收看《RWKV 社区最新动态》第五期,本期内容收录了 RWKV 社区 2024 年 9 月的最新动态。
9 月动态省流版(TL;DR)
- RWKV 官方新闻动态
- RWKV-7 发布预览版
- RWKV-7 论文撰写已面向社区开放
- RWKV 官网上线 Bad Case 收集页面
- RWKV 中文文档已开源
- RWKV 学术研究相关
- RWKV-CLIP 论文被 EMNLP 主会收录
- 新论文:OccRWKV(3D 语义占用预测)
- 新论文:MSRWKV-2DTCN(光伏发电预测)
- 新论文:Mod-RWKV(多模态内容审核)
- 新论文:OnlySportsLM(体育运动任务)
- 新论文:RWKV-TIM(人类动作交互建模)
- 社区新项目
- RWKV-nonogram
RWKV 官方新闻动态
RWKV-7 发布预览版
RWKV-7(代号 Goose 雁)现已推出预览版!
RWKV-7 超越了 attention / linear attention 范式,它的状态演化很灵活,可以解决在相同算力消耗下 attention 无法解决的问题。
- RWKV-7 代码:https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v7
- RWKV-7 模型(训练中):https://huggingface.co/BlinkDL/temp-latest-training-models/tree/main
详情查看: RWKV-7 预览版已发布,真正超越 attention 范式
RWKV-7 论文撰写面向社区开放
RWKV-7 论文的撰写已面向社区开放,请在此 Discord 频道 中参与论文讨论和撰写。
RWKV 官网上线 Bad Case 收集页面
RWKV 官网已上线 Bad Case 收集页面:https://rwkv.cn/feedback
我们邀请大家反馈 RWKV 模型回答效果不佳的示例。您的每次反馈,都可以帮助我们改进 RWKV 模型!
RWKV 中文文档已开源
rwkv.cn 的文档板块现已在 GitHub 仓库开源:https://github.com/LeoLin4258/rwkvcn-docs
我们欢迎任何关于 RWKV 文档的 Issue / PR ,让我们一起共建更完善的 RWKV 中文文档。
RWKV 学术研究相关
RWKV-CLIP 论文被 EMNLP 主会收录
RWKV-CLIP 被 EMNLP 主会收录!现可在 EMNLP 2024 的 CheckList 中查看。
OccRWKV(3D 语义占用预测)
- 论文名称:OccRWKV: Rethinking Efficient 3D Semantic Occupancy Prediction with Linear Complexity
- 论文链接:https://jmwang0117.github.io/OccRWKV/
- GitHub 仓库:https://github.com/jmwang0117/OccRWKV
- 发布时间:2024-09-06
论文提出了 “OccRWKV” :基于 RWKV 的 3D 语义占用预测,可用于自动驾驶、具身智能等领域。
OccRWKV 已提交至 ICRA 2025 。
实验表明,OccRWKV 在 SemanticKITTI 数据集达到 25.1 的 mIoU,比最佳基线 Co-Occ 快 20 倍,使其适合在机器人上实时部署,以增强自主导航效率。
MSRWKV-2DTCN(光伏发电预测)
- 论文名称:Multi-scale RWKV with 2-dimensional temporal convolutional network for short-term photovoltaic power forecasting
- 论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0360544224028433
- 发布时间:2024-09-06
论文提出了“多尺度 RWKV 二维时间卷积网络”(MSRWKV-2DTCN),将 FFT 和 2D TCN 与 RWKV 架构相结合,并应用于光伏发电预测。
研究证实,对比其他光伏发电功率预测模型,MSRWKV-2DTCN 在短期光伏发电功率预测方面具有更高的准确性。
Mod-RWKV(多模态内容审核)
- 论文名称:Experimentation in Content Moderation using RWKV
- 论文链接:https://arxiv.org/abs/2409.03939
- 发布时间:2024-09-05
论文提出了 Mod-RWKV ,研究了 RWKV 模型在内容审核方面的效果。
团队通过使用一个包含图像、视频、声音和文本的数据集对 RWKV 模型进行 SFT 微调,使其适用于各种内容的审查场景。
OnlySportsLM(体育运动任务)
- 论文名称:OnlySportsLM: Optimizing Sports-Domain Language Models with SOTA Performance under Billion Parameter
- 论文链接:https://arxiv.org/abs/2409.00286
- 发布时间:2024-08-30
论文提出了 OnlySportsLM :针对体育运动相关任务优化 RWKV-v6 架构,并训练了一个 196M 的 OnlySportsLM 模型。
Benchmark 显示,与 SOTA 135M/360M 体育运动模型相比, OnlySportsLM 的精度提高了 37.62%/34.08% ,其性能比肩运动领域的 SomlLM 1.7B 和 Qwen 1.5B 等较大参数模型。
RWKV-TIM(人类动作交互建模)
- 论文名称:Temporal and Interactive Modeling for Efficient Human-Human Motion Generation
- 论文链接:https://arxiv.org/abs/2408.17135
- 发布时间:2024-08-30
论文提出了时间交互式建模(Temporal and Interactive Modeling,TIM),将 RWKV 模型应用于生成人类之间的交互动作。
实验数据显示:TIM 仅使用 InterGen 数据集中 32% 的可训练参数,就取得了 SOTA 效果。
社区新项目
RWKV-nonogram
RWKV-nonogram 使用 RWKV-6 + Chain Of Thought 训练了一个 20M 参数 RWKV 模型,这个模型可以做数织(nonogram)任务。
RWKV-nonogram 的 CoT 过程:
关于《RWKV 社区动态》栏目
《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。
《RWKV 社区最新动态》不定期更新,所以请保持关注我们的微信公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开平台,以获取最新的消息。
加入 RWKV 社区
RWKV 是一种创新的深度学习网络架构,它将 Transformer 与 RNN 各自的优点相结合,同时实现高度并行化训练与高效推理。
- RWKV 中文官网(有多篇多模态论文):https://rwkv.cn/
- RWKV-5/6(Eagle & Finch)论文: https://arxiv.org/abs/2404.05892
- RWKV-4 论文: https://arxiv.org/abs/2305.13048
欢迎大家加入 RWKV 社区!可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
从零到一:我与 FormCreate 的成长故事
为了迎接 1024 程序员节,OSChina 开源中国新增了【家里有个程序员】栏目,记录一下 OSCer 们当前的生活,欢迎各位 OSCer 踊跃投稿呀。 投稿细则:https://my.oschina.net/u/3859945/blog/15727245 前言 大家好,我是xaboy,开源项目 FormCreate 的作者。很荣幸收到【家里有个程序员】栏目的邀请。收到邀请后,脑海中的回忆慢慢涌现,自己也工作了七八年,也有一些感悟。近两年我一直关注开源中国,所以决定记录一下,写写自己这几年的经历。 一、初期 在大学时,我学习的是汽车专业。毕业后实习了半年,发现自己对这个行业并没有兴趣。于是,我开始思考转行的可能性。在一次偶然的机会中,我接触到了 PHP 编程,并产生了浓厚的兴趣。在家自学了近一年,从 HTML 到 JavaScript,从 PHP 到数据库,每种语言都深入学习了一遍。 之后,我找到了一份软件行业的工作,经过半年的工作,我发现自己对这个行业的热爱。在工作中,我主要负责基础的模板套用,但我不想局限于此,决定辞职回家继续深造,深入学习数据结构、设计模式和 Web 开发等。2...
- 下一篇
开源日报 | “鸿蒙原生版”微信内测;开源AI代码工具Bolt.new;Python 3.13正式发布;对话Cursor团队;2024大模型之战;Tauri 2.0;开发者火冒三丈炮轰GenAI
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.10.8 今日要闻 微信鸿蒙原生版开始内测邀请 根据「鹅厂黑板报」公众号 10 月 8 日发布的消息,微信鸿蒙原生版已正式开始邀请内测,此外超 20 款腾讯 App 陆续适配中。 据悉,已升级至原生鸿蒙操作系统 HarmonyOS NEXT 的用户,可在收到邀请后抢先体验。这款 “尝鲜版” 的微信,已包含基础社交通讯、音视频通话、朋友圈、微信支付的二维码收 / 付款等功能。 Python 3.13.0 (final) 发布 Python 3.13.0 最新稳定版已于 10 月 7 日正式发布, 对语言、实现和标准库进行了一系列更改。Python 3.13 带来了两项重大更新:全局解释器锁的可选禁用 (no-GIL) 和实验性的即时编译器 (JIT)。GIL 的移除可提高基于线程的并行处理能力,从而优化多线程程序的性能;JIT 编译器将 Python 代码编译为机器代码,以提高代码执行效率。这些改进预计会显著提升 Python 代码的性能,尤其是在 CPU 密集型任务上。 Tauri 2.0 稳定版发布,Rus...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Linux系统CentOS6、CentOS7手动修改IP地址