2025年即将落幕,这一年对ROLL而言是充满生命力的起点。5月30日项目正式框架开源以来,我们经历了首次外宣的忐忑,见证了第一个社区开发者贡献的PR,目睹了issue从零增长到150,更在协作中打磨出环境开发框架ROCK。截止此刻,我们在GitHub已收获 2500+ star,越来越多的人听到并开始使用、甚至上手开发我们的项目。这些数字背后是成员们敲下的代码,留下的建议,以及深夜调试时屏幕前执着的眼神。
在迭代以周为单位的今天,闭源不会是技术发展最优的选择。ROLL选择开源,选择将价值释放给社区。这半年像一场共同养育的实验:我们被犀利的issue反馈敲打,被热心的代码贡献鼓舞,也被跨时区的技术讨论启发,正是这些真实的痕迹,让开源不再是一个技术决策,而是人与人间的握手仪式。即使项目还未满周岁,我们依然想用这份小结,和所有参与者一起回望,确认我们始终朝着正确的方向前行。
Github年鉴 “从第一行代码到2000星”
5月底开源以来,ROLL一直保持着活跃的更新频次,致力于将最新的能力、最好的体验带给社区用户。以下列举了项目这段时间的关键迭代,以及社区规模的参考数据:
学术副本通关 “这些arxiv快件已签收”
技术研究需要学术界与工业界的双手推动。过去半年,我们和上海交通大学、香港科技大学等高校的研究团队并肩工作,提出了3A协同优化框架、ROLLPacker方案等实用技术,期间产出多项论文,其中ROLLPacker方案已被系统领域顶会NSDI'26收录,非常感谢各位高校师生的协作与支持。期待与更多学术界、工业界伙伴一起交流、学习、进步。
Tech Report:https://arxiv.org/abs/2506.06122
LitePPO:https://arxiv.org/abs/2508.08221
ROLL Flash:https://arxiv.org/abs/2510.11345
Asymmetric Proximal Policy Optimization:https://arxiv.org/abs/2510.01656
Attention Illuminates LLM Reasoning:https://arxiv.org/abs/2510.13554
RollPacker:https://arxiv.org/abs/2509.21009
RollMux:https://arxiv.org/abs/2512.11306
开发者联机日志 “线上到线下的108种姿势”
今年我们也尝试了不同形式的社区活动:我们在魔搭、青稞AI、智源等技术社群进行直播分享,累计观看约7k人次,很多朋友通过直播认识了我们。同时项目也拓展了一些线下渠道,走进高校,参与行业和学术会议,与一线开发者、行业先锋面对面交流,构成了开源社区最坚实的温度。目前ROLL社群已近1k人。
开源英雄榜 “请各位代码侠亮个相”
运营开源项目,最最惊喜的莫过于感受到社区贡献的力量。诚然ROCK&ROLL还是非常年轻的项目,我们也在这半年里收获了第一批同路人。感谢以下几位贡献者的参与(显示为Github ID,排名不分先后),我们也准备了有纪念意义的周边礼品,希望延续这份情谊和认可。
已与部分贡献者建联,后续会拉群通知发奖事宜,还未建联的小伙伴请添加微信:tt19960718tt
礼品包含:contributor专属卫衣、ROCK&ROLL鸭舌帽、logo魔方数据线+挂件
再次感谢大家对我们的关注和认可,新的一年项目也将保持高速迭代,将ROCK&ROLL打造成更高效、文档、易用的强化学习基础设施。如果以上内容对你有启发和触动,非常欢迎加入我们,给项目点亮小星星,共建RL生态!
附录——对外分享材料
-
【视频】ROLL:高效且用户友好的大模型RL训练框架
-
【视频】ROLL 3A协同优化分享
-
【技术文章】阿里给智能体造了个实战演练场
-
【技术文章】阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化