美团开源推理大模型 LongCat-Flash-Thinking
美团发布了一款基于混合专家架构的大型推理模型LongCat-Flash-Thinking,总参数量达5600亿,根据上下文需求动态激活186亿至313亿参数,平均激活约270亿参数。
该模型在逻辑、数学、编程及Agent任务上表现出色,并声称在AIME25等任务上,使用原生工具可以减少64.5%的token消耗来达到顶级准确率。
根据官方公布的评测结果,LongCat-Flash-Thinking在多个基准测试中与其他主流模型进行了对比,在数学推理(如MATH500, AIME25)、通用推理(如GPQA-Diamond)、代码生成(如LiveCodeBench, OJBench)、Agent工具使用(如SWE-Bench, τ²-Bench)以及形式化定理证明(如MiniF2F-Test)等取得了接近领先模型的水平。
LongCat-Flash-Thinking的模型权重已根据MIT许可证开源。官方提供了详细的聊天模板,模型也已上线官方聊天网站。
https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking
https://longcat.chat/
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
甲骨文与 Meta 洽谈价值 200 亿美元的云计算协议
甲骨文(Oracle)目前正在与 Meta 平台进行高级别的谈判,商讨一项价值约200亿美元的多年度云计算协议。这项协议将使甲骨文能够为 Meta 提供大量的计算能力,以支持其人工智能模型的训练和部署,从而进一步补充 Meta 现有的云基础设施投资。 这一潜在的合作伙伴关系标志着科技行业在人工智能基础设施方面的快速变化。随着人工智能开发的加速,科技巨头们纷纷争相锁定大规模的计算资源。Meta 尤其在积极扩展其人工智能能力,尤其是其 Llama 大型语言模型,力求在云服务供应商的选择上实现多元化。 甲骨文的战略转变也引人注目。曾经被视为数据库软件的领导者,甲骨文现如今已迅速崛起为人工智能云基础设施的重要玩家。近期,甲骨文的云基础设施(OCI)业务实现了55% 的收入增长,且刚刚与 OpenAI 签署了一份价值3000亿美元的多年度合同,这也显示了其在人工智能领域的强劲实力。 值得注意的是,这一消息推动甲骨文的股票在单日内上涨了4%,并促使其2025年的股价上涨超过80%。此外,甲骨文的剩余业绩承诺(一个未来收入的关键指标)在最新一季度同比大幅增长359%,达到4550亿美元。 目前,甲骨...
-
下一篇
浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe
浙江大学网络空间安全学院与华为公司合作,共同发布了 DeepSeek R1 模型的安全加强版——DeepSeek-R1-Safe。 据介绍,该模型利用华为的昇腾芯片和 MindSpeedLLM 等框架进行开发,训练流程如下: 训练数据生成:构建安全、合规的数据集 安全监督训练:在训练过程中引入安全约束 安全强化学习:通过 RLHF 等方法优化模型行为 模型性能评测:对安全性能和通用性能进行全面评估 其核心优势在于显著提升安全防护能力的同时,有效保持模型的通用性能,从而在安全性与可用性之间实现了理想的平衡。 开源地址:https://github.com/ZJUAISafety/DeepSeek-R1-Safe
相关文章
文章评论
共有0条评论来说两句吧...


微信收款码
支付宝收款码