Meta 发布强化学习框架 LlamaRL-低调大师

Meta 发布强化学习框架 LlamaRL

2025-06-12 256

Meta 发布了 LlamaRL 强化学习框架，基于 PyTorch 构建全异步分布式架构，通过独立执行器并行处理生成、训练和评分任务，并整合 DDMA 和 NVLink 技术实现高效数据传输。

实测显示，该框架在 4050 亿参数模型中，将强化学习步骤耗时从 635.8 秒缩减至 59.5 秒，效率提升 10.7 倍，80 亿、700 亿参数模型训练时间分别缩短至 8.90 秒、20.67 秒。其突破内存瓶颈与 GPU 利用率难题，同时在 MATH 和 GSM8K 等标准测试中模型表现稳定甚至增强，为未来更大规模模型训练提供可扩展解决方案。

论文地址：https://arxiv.org/abs/2505.24034

微信关注我们

原文链接：https://www.oschina.net/news/355068

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

谷歌发布高效运行语言模型的 C++ 库：LiteRT-LM

谷歌发布了LiteRT-LM早期版本，这是一个C++库，用于在边缘平台上高效运行语言模型。 LiteRT-LM支持跨平台高效运行Gemma-3N系列模型，支持2B和4B参数模型，适用于桌面环境（Mac/Windows/Linux）及物联网设备。 LiteRT-LM的README写道：语言模型不再是一个单一模型，而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建，以支持这些流水线，包括： C++ API 高效运行语言模型跨平台支持，通过便携式 C++实现广泛部署场景灵活可定制，满足您的特定功能需求硬件加速，释放设备硬件的全部潜能开源地址 https://github.com/google-ai-edge/LiteRT-LM https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview

2025-06-12

222

阿里开源了名为「Mnn3dAvatar」的数字人框架，项目可以做到实时面捕然后映射到3D虚拟角色脸上（注意不是Live2D的，是3D的），甚至还能帮助创建一个3D虚拟角色。 https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md 据介绍，Mnn3dAvatar 是基于自研 3D 高斯溅射技术的 3D 数字人实时面捕方案，通过 AI 驱动实现高精度面部动作捕捉与实时渲染，支持语音、表情、手势等多模态驱动，可在手机、AR 设备等终端以90FPS 帧率流畅运行。其核心优势在于将影视级数字人效果落地到消费级硬件，仅需普通手机摄像头即可替代传统动捕设备，显著降低直播场景的部署门槛与成本，制作周期缩短至一周内，成本仅为传统 CG 方案的 1/30。

2025-06-12

191

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。