verl —— HybridFlow 论文的开源实现
verl 是一个灵活、高效且可用于生产的 RL 训练库,适用于大型语言模型 (LLM)。
verl 是 HybridFlow:一种灵活高效的 RLHF 框架 论文的开源实现。
verl 灵活且易于使用:
-
轻松扩展各种 RL 算法:混合编程模型结合了单控制器和多控制器范式的优势,能够灵活地表示和高效执行复杂的训练后数据流。允许用户用几行代码构建 RL 数据流。
-
现有 LLM 基础架构与模块化 API 无缝集成:解耦计算和数据依赖关系,实现与现有 LLM 框架(如 PyTorch FSDP、Megatron-LM 和 vLLM)无缝集成。此外,用户可以轻松扩展到其他 LLM 训练和推理框架。
-
灵活的设备映射:支持将模型放置到不同的 GPU 组上,以实现高效的资源利用率和跨不同集群规模的可扩展性。
-
轻松与流行的 HuggingFace 模型集成
verl 速度很快:
-
最先进的吞吐量:通过无缝集成现有的 SOTA LLM 训练和推理框架,verl 实现了高生成和训练吞吐量。
-
使用 3D-HybridEngine 进行高效的演员模型重新分片:消除内存冗余并显著减少训练和生成阶段之间转换期间的通信开销
主要特点
- FSDP和Megatron-LM用于训练。
- vLLM和TGI用于推出生成,SGLang支持即将推出。
- huggingface 模型支持
- 监督微调
- 使用PPO、GRPO、ReMax、Reinforce++、RLOO等 从人类反馈中进行强化学习
- 支持基于模型的奖励和基于函数的奖励(可验证的奖励)
- flash-attention、序列打包、通过 DeepSpeed Ulysses、LoRA、Liger-kernel提供长上下文支持
- 可扩展至 70B 模型和数百个 GPU
- 使用 wandb、swanlab 和 mlflow 进行实验跟踪

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
RWKV 社区 2 月动态:10 篇新学术论文!
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2025 年 2 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 2 月都有哪些新鲜事! 2 月动态省流版(TL;DR) RWKV 学术研究动态 新论文:Activation Sparsity in Recurrent LLMs(RWKV 能效神经形态计算) 新论文:SNAP(RWKV 混合神经网络架构) 新论文:ARWKV(从 DeepSeek 快速迁移到 RWKV 架构) 新论文:OmniRWKVSR(RWKV 图像超分辨率) 新论文:ET_MGNN(RWKV 脑部疾病诊断) 新论文:RWKV-UI(RWKV 高分辨率用户界面理解) 新论文:RWKV-Among-Us(RWKV 多智能体强化学习) 新论文:LALIC(RWKV 图像压缩) 新论文:RWKV 工业缺陷检测 新论文:Rwkv-vg(RWKV 视觉定位) RWKV 模型新闻动态 新模型: RKWV-7-2.9B 新模型: 新模型:Qwerky-72B 推理模型 G1 系列训练中 RWKV 社区活动 RWKV 开发者大会 2025 RWKV ...
- 下一篇
百川智能在深圳以 3000 万元成立科技公司
天眼查资料显示,深圳百方智能科技有限公司于近日成立,法定代表人为谢剑;注册资本3000万人民币,超过了 98% 的广东省同行。 企业经营范围含计算机系统服务、人工智能应用软件开发、人工智能双创服务平台、人工智能理论与算法软件开发、人工智能基础软件开发、人工智能通用应用系统等。 股东信息显示,该公司由北京百川智能科技有限公司全资持股。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7