Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型
Meta AI 近日推出了 MobileLLM-R1,这是一系列轻量级边缘推理模型,目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M,专注于高效的数学、编码和科学推理,且在不足10亿的参数规模下实现了优秀的性能表现。
MobileLLM-R1的最大模型为 MobileLLM-R1-950M,采用了一系列架构优化设计:包括22层 Transformer 结构、24个注意力头和6个分组 KV 头。模型的嵌入维度为1536,隐藏层维度为6144。
此外,模型还采用了分组查询注意力(GQA)来减少计算和内存需求,块级权重共享技术降低了参数数量而不显著增加延迟,SwiGLU 激活函数提升了小模型的表示能力。模型支持4K 的上下文长度和32K 的后训练模型。
在训练效率方面,MobileLLM-R1的表现同样引人注目。该模型总共在约4.2万亿个 token 上进行训练,相较于 Qwen3的0.6B 模型训练的36万亿 token,MobileLLM-R1仅使用了约11.7% 的数据便达到了或超越了 Qwen3的准确率。同时,模型在数学、编码和推理数据集上进行了监督微调,从而降低了训练成本和资源需求。
在各项基准测试中,MobileLLM-R1-950M 的表现优异:在 MATH500数据集上,其准确率比 OLMo-1.24B 高出约5倍,且比 SmolLM2-1.7B 高出约2倍。在 GSM8K、AIME 和 LiveCodeBench 等推理和编码任务上,MobileLLM-R1甚至与 Qwen3-0.6B 相匹配或超越,尽管所使用的 token 数量远少于后者。
不过,MobileLLM-R1的聚焦也带来了局限性。虽然在数学、编码和结构化推理方面表现强劲,但在一般对话、常识推理和创造性任务上,MobileLLM-R1的表现较大型模型有所不足。此外,模型在生产环境中的使用受到 FAIR NC(非商业)许可证的限制,较长的上下文(32K)也提高了推理时的 KV 缓存和内存需求。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
开发者必看:隐语框架的分层拆解和使用
打开链接点亮社区Star,照亮技术的前进之路。 每一个点赞,都是社区技术大佬前进的动力 Github 地址: https://github.com/secretflow/secretflow 一、"隐语"架构设计全貌 1.隐语框架设计思想 隐私计算是一个新兴的跨学科领域,涉及密码学、机器学习、数据库、硬件等多个领域。根据过去几年的实践经验,我们发现 隐私计算技术方向多样,不同场景下有其各自更为合适的技术解决方案 隐私计算学习曲线很高,非隐私计算背景的用户使用困难 隐私计算涉及领域众多,需要领域专家共同协作 隐语的设计目标是使得数据科学家和机器学习开发者可以非常容易地使用隐私计算技术进行数据分析和机器学习建模,而无需了解底层技术细节。 为达到这个目标,**隐语提供了一层设备抽象,**将多方安全计算(MPC)、同态加密(HE)和可信执行环境(TEE)等隐私计算技术抽象为密文设备, 将单方计算抽象为明文设备。 基于这层抽象,数据分析和机器学习工作流可以表示为一张计算图,其中节点表示某个设备上的计算,边表示设备之间的数据流动,不同类型设备之间的数据流动会自动进行协议转换。在这一点上,隐语借鉴了...
-
下一篇
Bing 在搜索结果页面添加 Edge 与 Chrome 的“记分牌”对比表
本周,当你在Bing上搜索“Chrome”时,会亲眼见证微软新版Edge广告的有趣一幕——微软专门制作了一张详细的对比表,每当用户尝试下载安装Chrome时,该表会在Bing的显眼处展示,直接将Edge和Chrome进行对比。 当用户在Bing上搜索“Chrome”,Bing会提示“一切上网所需就在这里”,显然指的就是Microsoft Edge。广告下方的简短描述写道:“Microsoft Edge基于与Chrome相同的技术,但拥有微软的信任加持。” 事实上Bing过去就常常以横幅推广Edge,但此次最吸引人注意的,是新增了“记分牌”对比表,明确将Edge列为“赢家”。 广告截图显示,该对比表卡片悬浮在搜索结果前方,左侧蓝色高亮的是Edge标志,而Chrome则被“灰掉”。微软用色彩和布局突出强调:Edge可获得奖励积分、内置VPN、AI个性化,且为“微软推荐”,更安全,专为Windows 11设计。 表格中,每一项Edge都打了勾号,而Chrome全是叉号。 这一卡片出现在Google Chrome官方下载链接上方,用户首先看到的就是微软的“推荐理由”,下方还有“了解更多Edge...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Linux系统CentOS6、CentOS7手动修改IP地址
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Crontab安装和使用
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Red5直播服务器,属于Java语言的直播服务器