美团正式发布并开源 LongCat-Flash-Omni-低调大师

美团正式发布并开源 LongCat-Flash-Omni

2025-11-03 63

美团宣布 LongCat-Flash 系列模型再升级，正式发布全新家族成员——LongCat-Flash-Omni。

据介绍，LongCat-Flash-Omni 是业界首个实现 “全模态覆盖、端到端架构、大参数量高效推理” 于一体的开源大语言模型，首次在开源范畴内实现了全模态能力对闭源模型的对标，并凭借创新的架构设计与工程优化，让大参数模型在多模态任务中也能实现毫秒级响应，解决了行业内推理延迟的痛点。

LongCat-Flash-Omni 以 LongCat-Flash 系列的高效架构设计为基础（ Shortcut-Connected MoE，含零计算专家），同时创新性集成了高效多模态感知模块与语音重建模块。即便在总参数 5600 亿（激活参数 270 亿）的庞大参数规模下，仍实现了低延迟的实时音视频交互能力，为开发者的多模态应用场景提供了更高效的技术选择。

综合评估结果表明，LongCat-Flash-Omni 在全模态基准测试中达到开源最先进水平（SOTA），同时在文本、图像、视频理解及语音感知与生成等关键单模态任务中，均展现出极强的竞争力。

LongCat-Flash-Omni 作为一款拥有极致性能的开源全模态模型，在一体化框架中整合了离线多模态理解与实时音视频交互能力。该模型采用完全端到端的设计，以视觉与音频编码器作为多模态感知器，由 LLM 直接处理输入并生成文本与语音token，再通过轻量级音频解码器重建为自然语音波形，实现低延迟的实时交互。

所有模块均基于高效流式推理设计，视觉编码器、音频编解码器均为轻量级组件，参数量均约为6亿，延续了 LongCat-Flash 系列的创新型高效架构设计，实现了性能与推理效率间的最优平衡。

LongCat-Flash-Omni 模型架构如下：

Hugging Face：https://huggingface.co/meituan-longcat/LongCat-Flash-Omni
Github：https://github.com/meituan-longcat/LongCat-Flash-Omni

微信关注我们

原文链接：https://www.oschina.net/news/381257

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Altman 否认 OpenAI 计划明年上市：年收入远超 130 亿美元

OpenAI 首席执行官萨姆・奥尔特曼（Sam Altman）与微软首席执行官萨提亚・纳德拉（Satya Nadella）展开了一场深度对话，揭示了关于 OpenAI 财务状况和未来发展的新信息。奥尔特曼在节目中透露，OpenAI 的年收入已远超130亿美元，而这一数据显然只是冰山一角。面对主持人布拉德・格斯特纳的提问，奥尔特曼坚决否认了关于 OpenAI 计划于明年上市的传闻。他表示，公司目前并没有具体的上市时间表，董事会也未对此作出任何决定。这一声明为那些对 OpenAI 即将上市充满期待的投资者泼了一盆冷水。不过，关于 OpenAI 的未来发展计划，奥尔特曼提到，OpenAI 近期与英伟达、AMD 和甲骨文等科技巨头签署了总价值高达1万亿美元的 AI 基础设施合同，旨在获得超过20吉瓦的强大算力，相当于20座核反应堆的能量。这一宏伟的计划显示了 OpenAI 在全球 AI 领域中的雄心壮志，但也引发了外界对其财务承载能力的质疑。在近期的报道中，路透社援引消息人士称，OpenAI 正在为首次公开募股（IPO）做准备，公司的估值有可能达到惊人的1万亿美元。这将可能成为历史上规模...

2025-11-03

61

阿里 Qwen Chat 官网已经为 Qwen-3 Max 模型启用“深度思考”功能（Qwen3-Max-Thinking）。用户现已可以通过该网站体验该模型，但该模型尚未上线 API。官方尚未发布模型的更多信息。根据先前披露，Qwen3-Max-Thinking 是 Qwen3-Max 的推理增强版本。它通过集成代码解释器并运用并行测试时计算技术，展现了前所未有的推理能力，尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上，均取得了满分。阿里云于 9 月 24 日推出了 Qwen3-Max，这是通义团队迄今为止规模最大、能力最强的语言模型，参数量突破 1 万亿，预训练数据高达 36T tokens。Qwen3-Max-Instruct 正式版在代码能力和智能体能力方面进一步提升，在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

2025-11-03

104

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。