Stanford 团队展现 RWKV 多智能体优势,UVa 团队突破 RWKV 端侧性能
近日 RWKV 生态新增来自海外名校的两项工作:Stanford(斯坦福大学)团队的 RWKV 多智能体研究,和 UVa(弗吉尼亚大学) 团队的 RWKV 端侧优化研究。 RWKV 多智能体强化学习 开源项目地址:https://socialdeductionllm.github.io/ 论文:https://arxiv.org/abs/2502.06060 四名斯坦福大学研究人员共同发布了《Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning》论文,研究使用多智能体强化学习(multi-agent reinforcement learning)训练 RWKV 模型,使其能通过自然语言交流完成**《Among Us》游戏**的推理过程并赢下游戏。 论文已被 AAMAS 2025 主会(口头报告)接收,论文作者在 RWKV Discord 频道分享了这一消息,并分享了“为什么使用 RWKV-4-World 模型”。 为何选择 RWKV 而非 Transformer? 因为...
