欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2026 年 1 月的最新动态。
1 月动态省流版(TL;DR)
-
RWKV 模型新闻动态
- RWKV7-G1c 系列模型 13B/7B/3B 发布
-
RWKV 学术研究动态
- Hi-RWKV: Hierarchical RWKV Modeling for Hyperspectral Image Classification(用于高光谱图像分类的分层 RWKV 模型,发表于中科院 1 区 TOP 期刊IEEE TIP)
- Natural Cognizing Video: A Decoupling and Integration Network for General Event Boundary Captioning(在视频事件边界描述中引入 RWKV 层,发表于中科院 1 区 TOP 期刊IEEE TMM)
- IESS-FusionNet: Physiologically Inspired EEG-EMG Fusion with Linear Recurrent Attention for Infantile Epileptic Spasms Syndrome Detection(基于 RWKV 线性循环注意力的 EEG-EMG 融合模型,发表于期刊 Bioengineering)
- DyRSRNet: A Lightweight Super-Resolution Framework Based on Dynamic Recursive State-Space Networks(嵌入 DyRWKV 机制的轻量级超分辨率框架)
- Graph fusion model for unimodal and multimodal fake news detection(在文本编码中嵌入 RWKV MLP-mixer 的假新闻检测模型,论文为茨城大学博士学位论文)
- Pretrained Bi-RWKV Model(具有双向上下文建模能力的 Bi-RWKV 预训练模型)
- A Method for Detecting Spatio-temporal Correlation Anomalies of WSN Nodes Based on Topological Information Enhancement and Time-frequency Feature Extraction(在无线传感器网络异常检测中嵌入基于 RWKV 的 CFE 模块)
- EmbeddingRWKV: State-Centric Retrieval with Reusable States(基于 RWKV 的状态中心化检索与重排模型,实现状态可复用)
- MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction(引入 Vision-RWKV 模块的雷达序列预测网络)
- Exploring Linear Attention in Underwater Image Enhancement with Retinex Theory(结合 Retinex 理论与 RWKV 的水下图像增强框架)
- HFRWKV: A High-Performance Fully On-Chip Hardware Accelerator for RWKV(针对 RWKV 模型的高性能全芯片硬件加速器)
-
RWKV 社区市场活动
- 元始智能与九天睿芯达成战略合作
- RWKV 第1期论文研讨会
-
RWKV 社区项目动态
- ROSA-Visualizer
- rwkv-code-completion
- rwkv_lightning
- rwkv-vibe-code
RWKV 模型新闻动态
2025 年 12 月 31 日,RWKV7-G1c 系列模型 13B/7B/3B 发布,G1c 系列的预训练质量可靠,通过 State-tuning 可轻松高效完成复杂任务。
RWKV 学术研究动态
Hi-RWKV: Hierarchical RWKV Modeling for Hyperspectral Image Classification
论文在分层编码器的每个阶段嵌入 Hi-RWKV 块作为核心处理模块,通过双向空间传播和边缘感知门控实现全局空间上下文建模,并引入可学习的波段嵌入和通道混合增强跨波段判别性,以线性复杂度实现高效的像素级分类。
论文效果出色,发表于中科院 1 区 TOP 期刊 IEEE TIP。
{{{width="auto" height="auto"}}}
Natural Cognizing Video
论文在事件分支的编码器中嵌入 RWKV 层,用于处理视频帧序列以建模动态变化,结合 Transformer 的并行训练和 RNN 的高效推理优势,提升状态前后描述的生成准确性。
论文新颖有效,发表于中科院 1 区 TOP 期刊 IEEE TMM。
{{{width="auto" height="auto"}}}
IESS-FusionNet
- 论文名称:IESS-FusionNet: Physiologically Inspired EEG-EMG Fusion with Linear Recurrent Attention for Infantile Epileptic Spasms Syndrome Detection
- 论文链接:https://www.mdpi.com/2306-5354/13/1/57
- 发布日期:2025-12-31
该研究基于 RWKV 的线性循环注意力,提出了 Cross Time-Mixing 模块,用于 EEG-EMG 信号的高效跨模态融合。IESS-FusionNet 框架结合了单模态编码器,实现了对婴儿癫痫性痉挛综合征的精准检测,性能优于基线且计算高效。
论文发表于期刊 Bioengineering,在生物医学信号处理领域展现了 RWKV 的跨模态融合潜力。
{{{width="auto" height="auto"}}}
DyRSRNet
在 VRSE 模块中嵌入 DyRWKV 机制,通过双向递归加权键值建模增强跨方向空间依赖性和通道交互,提升纹理细节恢复。在 RCSS 模块中堆叠方向感知状态路径,结合选择性扫描和动态调制实现长程上下文表示和结构恢复。
{{{width="auto" height="auto"}}}
Graph fusion model for unimodal and multimodal fake news detection
论文在单模态检测模型 CMGN 的文本编码模块中嵌入 RWKV MLP-mixer,替换传统 MLP 以捕获新闻文本的长程依赖关系,生成高维向量用于后续特征融合,提升检测准确率。
本研究为茨城大学博士学位论文,展示了 RWKV 组件在提升假新闻检测模型文本特征提取能力方面的应用。
{{{width="auto" height="auto"}}}
Pretrained Bi-RWKV Model
论文在 Bi-RWKV-at 架构中,用双向 Time Mixing 模块替换单向 RWKV 的 Time Mixing,实现双向上下文建模;并行处理前向和后向路径,通过加法合并输出,提升自然语言理解任务的性能;同时保持线性时间复杂度,相比 Transformer 获得 1.95 倍推理速度提升。
{{{width="auto" height="auto"}}}
A Method for Detecting Spatio-temporal Correlation Anomalies
- 论文名称:A Method for Detecting Spatio-temporal Correlation Anomalies of WSN Nodes Based on Topological Information Enhancement and Time-frequency Feature Extraction
- 论文链接:https://arxiv.org/abs/2601.11951
- 发布日期:2026-01-17
论文在时间域和频率域特征提取分支中,嵌入基于 RWKV 的 CFE 模块,以并行训练处理长距离依赖任务并降低计算复杂度,充分提取不同时间模态间的时序相关性特征。
{{{width="auto" height="auto"}}}
EmbeddingRWKV: State-Centric Retrieval with Reusable States
论文使用 RWKV 作为检索和重排的统一骨干网络,通过状态表示学习生成可复用状态,实现离线状态缓存。在重排阶段仅处理查询令牌,将推理成本与文档长度解耦,获得 5.4×--44.8× 加速。
{{{width="auto" height="auto"}}}
MFC-RFNet
该研究在 MFC-RFNet 中引入轻量级 Vision-RWKV 模块,用于高效捕获雷达序列的长程时空依赖。模型结合了多尺度特征通信、空间对齐和小波引导融合,并通过 Rectified Flow 训练实现快速采样。实验表明,该方法在多个降水临近预报数据集上超越了基线模型,尤其在高降雨率预测上表现更优。
{{{width="auto" height="auto"}}}
Exploring Linear Attention in Underwater Image Enhancement with Retinex Theory
本文提出 Retinex-RWKV 框架,将改进的 RWKV 线性注意力机制与 Retinex 理论结合,用于水下图像增强。该模型通过 SS2D-WKV 和 Omni-token shift 等设计,有效提升了特征提取能力。实验表明,该方法在定量和定性评估上均优于现有方法,能生成更高质量的图像。
{{{width="auto" height="auto"}}}
HFRWKV
论文针对 RWKV 模型在 GPU 上并行性差与内存瓶颈的问题,本文提出了 HFRWKV 硬件加速器。该设计通过混合精度量化策略与全芯片计算架构,显著提升了模型的推理吞吐量与能效。
{{{width="auto" height="auto"}}}
社区市场活动
元始智能与九天睿芯达成战略合作
2025 年 12 月 31 日,深圳元始智能有限公司与深圳市九天睿芯科技有限公司正式达成战略合作。此次合作,标志着AI大模型架构与底层硬件创新的深度融合,将为端侧智能计算开启全新的篇章。
{{{width="auto" height="auto"}}}
RWKV 第1期论文研讨会
2026 年 1 月 28 日,RWKV 第1期论文研讨会于线上顺利举行,侯皓文博士围绕 VisualRWKV 系列研究工作展开,介绍了基于 RWKV 架构的视觉语言模型设计思路与关键技术。
{{{width="auto" height="auto"}}}
RWKV 社区项目动态
ROSA-Visualizer
使用朴素算法(非后缀自动机)对 RWKV-8 ROSA 机制的 1bit 形式进行可视化展示。
{{{width="auto" height="auto"}}}
rwkv-code-completion
基于 RWKV 模型的智能代码补全插件,支持实时补全,设计了多选择模式:同时生成 4 个补全建议,2×2 网格展示;同时 FIM Fill-in-the-Middle(填充中间),智能理解上下文;并防抖优化:停止输入后才触发,避免频繁请求;
{{{width="auto" height="auto"}}}
rwkv_lightning
RWKV 批量推理后端,基于 Albatross 和 Robyn 开发,适用于在 NVIDIA GPU 上使用 RWKV 进行多路并发和批量推理。
{{{width="auto" height="auto"}}}
rwkv-vibe-code
RWKV 高并发网页生成前端,基于 React 和 Rsbuild,结合 rwkv_lightning 可进行批量网页生成。
{{{width="auto" height="auto"}}}
加入 RWKV 社区
欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。