Liquid AI 发布 LFM2-8B-A1B：8B 参数仅激活 1.5B-低调大师

Liquid AI 发布 LFM2-8B-A1B：8B 参数仅激活 1.5B

2025-10-11 153

高效MoE架构重塑边缘AILiquid AI推出的LFM2-8B-A1B是其LFM2系列的首个混合专家（Mixture-of-Experts， MoE）模型，总参数规模达8.3B，但每token仅激活约1.5B参数。这种稀疏激活机制在保持高表示能力的同时，大幅降低计算负载，使其适用于资源受限的设备端场景。不同于传统云端MoE模型，该设计针对实时交互优化，挑战了“小规模MoE不高效”的行业认知。

模型基于LFM2混合骨干架构，包括18个门控短卷积块和6个分组查询注意力（GQA）块。除前两层保持稠密以确保稳定性外，其余层均集成稀疏MoE前馈网络。每层配备32个专家，仅激活top-4专家，并采用归一化sigmoid路由器结合自适应偏置，实现负载均衡。支持32K上下文长度，兼容英文、阿拉伯文、中文、法文、德文、日文、韩文和西班牙文等多语言。

训练与性能：12T令牌铸就3-4B级能力LFM2-8B-A1B通过约12T令牌的预训练实现，包括55%英文、25%多语言和20%代码数据分布。随后采用Liquid Preference Alignment（长度归一化DPO/APO-Zero融合）进行后训练，使用混合BF16/FP8精度，提升训练效率3倍以上。

在基准测试中，该模型展现出超越同规模竞争者的实力：

知识与指令跟随：MMLU-Pro得分37.4（较LFM2-2.6B提升11.5），IFEval77.6，Multi-IF58.2。
数学能力：GSM8K84.4，GSMPlus64.8，MATH50074.2。
多语言处理：MGSM72.4，MMMLU55.3。
编码与写作：HumanEval+69.5，LiveCodeBench v621.0，EQ-Bench44.2。

整体而言，其输出质量媲美3-4B稠密模型，在多轮对话、创意写作、RAG检索增强生成和工具调用等任务中表现出色。部署与集成：5倍加速，适配主流框架LFM2-8B-A1B在CPU和GPU上的推理速度显著领先。

在AMD Ryzen AI9HX370和三星Galaxy S24Ultra等设备上，使用int4量化与int8动态激活的自定义XNNPACK MoE内核，其解码吞吐量比Qwen3-1.7B、IBM Granite4.0等快达5倍。GPU端集成vLLM，支持FlashInfer和CUDA-graph编译，实现单请求与在线批处理的高效运行。

量化变体已优化至高配手机/平板/笔记本：Q4_0约4.7GB，F16约16.7GB。支持框架包括llama.cpp（需b6709+版本支持lfm2moe）、ExecuTorch(移动/嵌入式CPU)和vLLM(GPU)。此外，提供Hugging Face上的GGUF量化文件及Colab微调笔记本，便于开发者快速上手。模型已在Liquid Playground上线测试。

微信关注我们

原文链接：https://www.oschina.net/news/376832

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

全球金融监管机构拟加强对人工智能的监控

随着银行及金融行业其他领域加速应用人工智能，全球金融监管机构已制定计划，将加强对相关风险的监控。监管机构提出的担忧包括：过多金融机构最终可能使用相同的人工智能模型及专用硬件，这或将导致 “羊群效应” 式的趋同行为。二十国集团（G20）下属风险监管机构 —— 金融稳定委员会（Financial Stability Board）在报告中指出：“若可选择的替代方案有限，这种高度依赖可能会引发风险隐患。” 此外，中央银行合作机构 —— 国际清算银行（Bank for International Settlements，简称 BIS）发布的另一项研究报告称，各国央行、金融监管机构及监督部门在人工智能领域 “迫切需要” 提升自身应对能力。国际清算银行表示：“无论是作为技术进步影响的知情观察者，还是作为该技术的使用者，这些机构都需要提升自身能力。”

2025-10-11

143

继Windows 11 25H2版本发布约一周后，微软又为开发者和高级用户带来了一个实用的新功能——Edit命令行文本编辑器。这款新工具已经被添加到Windows 11 25H2和24H2版本的KB5065789（Build 26100.6725）预览更新中。与Linux发行版和苹果macOS系统自带Vim和Nano编辑器不同，64位Windows系统一直缺少一款原生的命令行编辑器。这使得开发者和系统管理员不得不依赖第三方工具，或者使用功能逐渐臃肿的记事本来进行快速编辑。 Edit正是为了填补这一长期存在的空白，微软在官方更新日志中指出：“[命令行]新功能！Windows现在包括Edit，一款您可以在命令行中使用的文本编辑器。要编辑文件，只需打开终端应用程序并输入edit，后跟文件名即可。” Edit是一款轻量级的开源命令行文本编辑器，其文件大小不足250KB，支持多文件编辑、鼠标模式导航等多种功能。此外，Edit采用了无模式编辑的设计理念，并搭配文本用户界面以降低新用户的入门门槛。（快科技）

2025-10-11

124

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。