Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B
高效MoE架构重塑边缘AILiquid AI推出的LFM2-8B-A1B是其LFM2系列的首个混合专家(Mixture-of-Experts, MoE)模型,总参数规模达8.3B,但每token仅激活约1.5B参数。这种稀疏激活机制在保持高表示能力的同时,大幅降低计算负载,使其适用于资源受限的设备端场景。不同于传统云端MoE模型,该设计针对实时交互优化,挑战了“小规模MoE不高效”的行业认知。
模型基于LFM2混合骨干架构,包括18个门控短卷积块和6个分组查询注意力(GQA)块。除前两层保持稠密以确保稳定性外,其余层均集成稀疏MoE前馈网络。每层配备32个专家,仅激活top-4专家,并采用归一化sigmoid路由器结合自适应偏置,实现负载均衡。支持32K上下文长度,兼容英文、阿拉伯文、中文、法文、德文、日文、韩文和西班牙文等多语言。
训练与性能:12T令牌铸就3-4B级能力LFM2-8B-A1B通过约12T令牌的预训练实现,包括55%英文、25%多语言和20%代码数据分布。随后采用Liquid Preference Alignment(长度归一化DPO/APO-Zero融合)进行后训练,使用混合BF16/FP8精度,提升训练效率3倍以上。
在基准测试中,该模型展现出超越同规模竞争者的实力:
- 知识与指令跟随:MMLU-Pro得分37.4(较LFM2-2.6B提升11.5),IFEval77.6,Multi-IF58.2。
- 数学能力:GSM8K84.4,GSMPlus64.8,MATH50074.2。
- 多语言处理:MGSM72.4,MMMLU55.3。
- 编码与写作:HumanEval+69.5,LiveCodeBench v621.0,EQ-Bench44.2。
整体而言,其输出质量媲美3-4B稠密模型,在多轮对话、创意写作、RAG检索增强生成和工具调用等任务中表现出色。部署与集成:5倍加速,适配主流框架LFM2-8B-A1B在CPU和GPU上的推理速度显著领先。
在AMD Ryzen AI9HX370和三星Galaxy S24Ultra等设备上,使用int4量化与int8动态激活的自定义XNNPACK MoE内核,其解码吞吐量比Qwen3-1.7B、IBM Granite4.0等快达5倍。GPU端集成vLLM,支持FlashInfer和CUDA-graph编译,实现单请求与在线批处理的高效运行。
量化变体已优化至高配手机/平板/笔记本:Q4_0约4.7GB,F16约16.7GB。支持框架包括llama.cpp(需b6709+版本支持lfm2moe)、ExecuTorch(移动/嵌入式CPU)和vLLM(GPU)。此外,提供Hugging Face上的GGUF量化文件及Colab微调笔记本,便于开发者快速上手。模型已在Liquid Playground上线测试。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
全球金融监管机构拟加强对人工智能的监控
随着银行及金融行业其他领域加速应用人工智能,全球金融监管机构已制定计划,将加强对相关风险的监控。 监管机构提出的担忧包括:过多金融机构最终可能使用相同的人工智能模型及专用硬件,这或将导致 “羊群效应” 式的趋同行为。 二十国集团(G20)下属风险监管机构 —— 金融稳定委员会(Financial Stability Board)在报告中指出:“若可选择的替代方案有限,这种高度依赖可能会引发风险隐患。” 此外,中央银行合作机构 —— 国际清算银行(Bank for International Settlements,简称 BIS)发布的另一项研究报告称,各国央行、金融监管机构及监督部门在人工智能领域 “迫切需要” 提升自身应对能力。 国际清算银行表示:“无论是作为技术进步影响的知情观察者,还是作为该技术的使用者,这些机构都需要提升自身能力。”
-
下一篇
Windows 11 推送命令行编辑器 Edit:未来将成预装软件
继Windows 11 25H2版本发布约一周后,微软又为开发者和高级用户带来了一个实用的新功能——Edit命令行文本编辑器。 这款新工具已经被添加到Windows 11 25H2和24H2版本的KB5065789(Build 26100.6725)预览更新中。 与Linux发行版和苹果macOS系统自带Vim和Nano编辑器不同,64位Windows系统一直缺少一款原生的命令行编辑器。 这使得开发者和系统管理员不得不依赖第三方工具,或者使用功能逐渐臃肿的记事本来进行快速编辑。 Edit正是为了填补这一长期存在的空白,微软在官方更新日志中指出:“[命令行]新功能!Windows现在包括Edit,一款您可以在命令行中使用的文本编辑器。要编辑文件,只需打开终端应用程序并输入edit,后跟文件名即可。” Edit是一款轻量级的开源命令行文本编辑器,其文件大小不足250KB,支持多文件编辑、鼠标模式导航等多种功能。此外,Edit采用了无模式编辑的设计理念,并搭配文本用户界面以降低新用户的入门门槛。(快科技)
相关文章
文章评论
共有0条评论来说两句吧...