Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型-低调大师

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型

2025-09-16 100

Meta AI 近日推出了 MobileLLM-R1，这是一系列轻量级边缘推理模型，目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M，专注于高效的数学、编码和科学推理，且在不足10亿的参数规模下实现了优秀的性能表现。

MobileLLM-R1的最大模型为 MobileLLM-R1-950M，采用了一系列架构优化设计:包括22层 Transformer 结构、24个注意力头和6个分组 KV 头。模型的嵌入维度为1536，隐藏层维度为6144。

此外，模型还采用了分组查询注意力（GQA）来减少计算和内存需求，块级权重共享技术降低了参数数量而不显著增加延迟，SwiGLU 激活函数提升了小模型的表示能力。模型支持4K 的上下文长度和32K 的后训练模型。

在训练效率方面，MobileLLM-R1的表现同样引人注目。该模型总共在约4.2万亿个 token 上进行训练，相较于 Qwen3的0.6B 模型训练的36万亿 token，MobileLLM-R1仅使用了约11.7% 的数据便达到了或超越了 Qwen3的准确率。同时，模型在数学、编码和推理数据集上进行了监督微调，从而降低了训练成本和资源需求。

在各项基准测试中，MobileLLM-R1-950M 的表现优异:在 MATH500数据集上，其准确率比 OLMo-1.24B 高出约5倍，且比 SmolLM2-1.7B 高出约2倍。在 GSM8K、AIME 和 LiveCodeBench 等推理和编码任务上，MobileLLM-R1甚至与 Qwen3-0.6B 相匹配或超越，尽管所使用的 token 数量远少于后者。

不过，MobileLLM-R1的聚焦也带来了局限性。虽然在数学、编码和结构化推理方面表现强劲，但在一般对话、常识推理和创造性任务上，MobileLLM-R1的表现较大型模型有所不足。此外，模型在生产环境中的使用受到 FAIR NC（非商业）许可证的限制，较长的上下文(32K)也提高了推理时的 KV 缓存和内存需求。

微信关注我们

原文链接：https://www.oschina.net/news/372545

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

开发者必看：隐语框架的分层拆解和使用

打开链接点亮社区Star，照亮技术的前进之路。每一个点赞，都是社区技术大佬前进的动力 Github 地址： https://github.com/secretflow/secretflow 一、"隐语"架构设计全貌 1.隐语框架设计思想隐私计算是一个新兴的跨学科领域，涉及密码学、机器学习、数据库、硬件等多个领域。根据过去几年的实践经验，我们发现隐私计算技术方向多样，不同场景下有其各自更为合适的技术解决方案隐私计算学习曲线很高，非隐私计算背景的用户使用困难隐私计算涉及领域众多，需要领域专家共同协作隐语的设计目标是使得数据科学家和机器学习开发者可以非常容易地使用隐私计算技术进行数据分析和机器学习建模，而无需了解底层技术细节。为达到这个目标，**隐语提供了一层设备抽象，**将多方安全计算(MPC)、同态加密(HE)和可信执行环境(TEE)等隐私计算技术抽象为密文设备，将单方计算抽象为明文设备。基于这层抽象，数据分析和机器学习工作流可以表示为一张计算图，其中节点表示某个设备上的计算，边表示设备之间的数据流动，不同类型设备之间的数据流动会自动进行协议转换。在这一点上，隐语借鉴了...

2025-09-16

107

本周，当你在Bing上搜索“Chrome”时，会亲眼见证微软新版Edge广告的有趣一幕——微软专门制作了一张详细的对比表，每当用户尝试下载安装Chrome时，该表会在Bing的显眼处展示，直接将Edge和Chrome进行对比。当用户在Bing上搜索“Chrome”，Bing会提示“一切上网所需就在这里”，显然指的就是Microsoft Edge。广告下方的简短描述写道：“Microsoft Edge基于与Chrome相同的技术，但拥有微软的信任加持。” 事实上Bing过去就常常以横幅推广Edge，但此次最吸引人注意的，是新增了“记分牌”对比表，明确将Edge列为“赢家”。广告截图显示，该对比表卡片悬浮在搜索结果前方，左侧蓝色高亮的是Edge标志，而Chrome则被“灰掉”。微软用色彩和布局突出强调：Edge可获得奖励积分、内置VPN、AI个性化，且为“微软推荐”，更安全，专为Windows 11设计。表格中，每一项Edge都打了勾号，而Chrome全是叉号。这一卡片出现在Google Chrome官方下载链接上方，用户首先看到的就是微软的“推荐理由”，下方还有“了解更多Edge...

2025-09-16

92

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。