美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
今天,我们正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。
根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat 在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备突出优势。并且,因为面向推理效率的设计和创新,LongCat-Flash-Chat 具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。
目前,我们在 Github、Hugging Face 平台同步开源,同时你也可以访问官网 https://longcat.ai/,与 LongCat-Flash-Chat 开启对话。
技术亮点
LongCat-Flash 模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,总参数量 560 B,每个 token 依据上下文需求仅激活 18.6B~31.3 B 参数,实现算力按需分配和高效利用。为控制总算力消耗,训练过程采用 PID 控制器实时微调专家偏置,将单 Token 平均激活量稳定在约 27 B。
此外,LongCat-Flash 在层间铺设跨层通道,使 MoE 的通信和计算能很大程度上并行,极大提高了训练和推理效率。配合定制化的底层优化,LongCat-Flash 在 30 天内完成高效训练,并在 H800 上实现单用户 100+ tokens/s 的推理速度。LongCat-Flash 还对常用大模型组件和训练方式进行了改进,使用了超参迁移和模型层叠加的方式进行训练,并结合了多项策略保证训练稳定性,使得训练全程高效且顺利。
针对智能体(Agentic)能力,LongCat-Flash 自建了 Agentic 评测集指导数据策略,并在训练全流程进行了全面的优化,包括使用多智能体方法生成多样化高质量的轨迹数据等,实现了优异的智能体能力。
通过算法和工程层面的联合设计,LongCat-Flash 在理论上的成本和速度都大幅领先行业同等规模、甚至规模更小的模型;通过系统优化,LongCat-Flash 在 H800 上达成了 100 tokens/s 的生成速度,在保持极致生成速度的同时,输出成本低至 5 元/百万 Token。
性能评估
全面且严谨的评估表明,LongCat-Flash 是一款强大且全能的模型,它在多个领域表现出卓越的性能优势。以下将从不同维度详细解读:
-
在 通用领域知识 方面,LongCat-Flash 表现出强劲且全面的性能:在 ArenaHard-V2 基准测试中取得 86.50 的优异成绩,位列所有评估模型中的第二名,充分体现了其在高难度“一对一”对比中的稳健实力。在基础基准测试中仍保持高竞争力,MMLU(多任务语言理解基准)得分为 89.71,CEval(中文通用能力评估基准)得分为 90.44。这些成绩可与目前国内领先的模型比肩,且其参数规模少于 DeepSeek-V3.1、Kimi-K2 等产品,体现出较高的效率。
-
在 智能体(Agentic)工具使用 方面,LongCat-Flash 展现出明显优势:即便与参数规模更大的模型相比,其在 τ2-Bench(智能体工具使用基准)中的表现仍超越其他模型;在高复杂度场景下,该模型在 VitaBench(复杂场景智能体基准)中以 24.30 的得分位列第一,彰显出在复杂场景中的强大处理能力。
-
在 编程 方面,LongCat-Flash 展现出扎实的实力:其在 TerminalBench(终端命令行任务基准)中,以 39.51 的得分位列第二,体现出在实际智能体命令行任务中的出色熟练度;在 SWE-Bench-Verified(软件工程师能力验证基准)中得分为 60.4,具备较强竞争力。
-
在 指令遵循 方面,LongCat-Flash 优势显著:在 IFEval(指令遵循评估基准)中以 89.65 的得分位列第一,展现出在遵循复杂且细致指令时的卓越可靠性;此外,在 COLLIE(中文指令遵循基准)和 Meeseeks-zh(中文多场景指令基准)中也斩获最佳成绩,分别为 57.10 和 43.03,凸显其在中英文两类不同语言、不同高难度指令集上的出色驾驭能力。
模型部署
我们同步提供了分别基于 SGLang 和 vLLM 的两种高效部署方案,助您轻松部署、快速体验模型效果。
以下为使用 SGLang 进行单机部署的示例:
python3 -m sglang.launch_server \
--model meituan-longcat/LongCat-Flash-Chat-FP8 \
--trust-remote-code \
--attention-backend flashinfer \
--enable-ep-moe \
--tp 8
其他更为详细的部署指导请参阅 LongCat-Flash-Chat 仓库:
https://github.com/meituan-longcat/LongCat-Flash-Chat
全面开放,即刻体验
前往 https://longcat.ai/,立即与 LongCat-Flash-Chat 开启对话。
开源平台地址:
-
Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
-
Github:https://github.com/meituan-longcat/LongCat-Flash-Chat
此次我们的开源仓库统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
| 关注「美团技术团队」微信公众号,在公众号菜单栏对话框回复【2024年货】、【2023年货】、【2022年货】、【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可查看美团技术团队历年技术文章合集。
| 本文系美团技术团队出品,著作权归属美团。欢迎出于分享和交流等非商业目的转载或使用本文内容,敬请注明“内容转载自美团技术团队”。本文未经许可,不得进行商业性转载或者使用。任何商用行为,请发送邮件至 tech@meituan.com 申请授权。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
火狐退出中国后,Zen 浏览器会是「理想平替」吗?
引言 从隐私保护到扩展兼容,无缝承接国内用户需求,用革新设计重塑浏览体验 Mozilla Firefox(火狐浏览器)曾是国内不少用户的「隐私首选」------凭借开源内核、丰富扩展生态和自主可控的隐私设置,它一度成为避开 Chromium 生态的重要选择。但近日火狐即将宣布彻底关闭中国市场后,不仅官方服务支持中断、本地化功能(如中文同步、国内镜像更新)逐步失效,「如何找到一款既能继承火狐优势、又适配国内使用场景的浏览器」,成了许多老用户的难题。 而如果有人问「火狐本可以变得更好吗?」,这个问题的答案,或许就藏在 Zen 浏览器里,还原火狐本该有的样子! 什么是 Zen 浏览器?------ 火狐生态的「继承者」与「革新者」 Zen 是一款免费开源的 Firefox 衍生浏览器,支持 Windows、macOS 和 Linux 系统(完美覆盖国内用户主流设备),自 2024 年推出以来,始终以「还原火狐潜力」为核心,目前虽处于测试版阶段,但已具备日常使用的稳定性。 对曾依赖火狐的国内用户来说,Zen 最核心的价值在于「无缝继承」:它完整保留了 Firefox 的扩展生态、网页标准兼容性...
-
下一篇
亲测 8 款 AI 网页应用构建工具!附结果及选型指南
从全栈代码生成到一键部署,这些 AI 开发工具帮你快速落地项目 V0(由 Vercel 开发)是一款强大的 AI 网页应用构建工具,能将提示词和 Figma 文件转化为 UI 组件、Next.js 应用及原型。它速度快、操作直观,很适合追求"流畅开发节奏"的开发者。 但和多数 AI 编码工具一样,V0 也存在明显局限:定制化难度高、规模扩大后成本飙升,且频繁出现"AI 幻觉"(生成错误代码),仍需手动修正。 随着开发者对"更实用 AI 应用构建工具"的需求增长,一批替代方案应运而生------它们不仅能生成可投入生产环境的代码,还支持全栈开发、移动端适配、GitHub 同步及一键部署。 本文将盘点 8 款与 V0 类似的 AI 网页应用构建工具,帮你实现: 生成可直接上线的前端+后端代码 结合实时预览与 GitHub 同步,加速原型开发 借助内置托管服务,一键启动项目 轻松集成认证、支付、数据库功能,实现项目规模化 无论你是独立开发者、创业公司创始人、产品经理还是设计师,这些工具都能帮你"更快交付产品"。接下来,我们逐一拆解: 过程中,我们会以一个实际的项目需求作为测试用例。 测试用例...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7设置SWAP分区,小内存服务器的救世主
- MySQL数据库在高并发下的优化方案
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Dcoker安装(在线仓库),最新的服务器搭配容器使用