蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0-低调大师

蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0

2025-09-18 145

蚂蚁百灵大模型团队正式发布 Ring-mini-2.0，一款基于 Ling-mini-2.0 架构深度优化的高性能推理型 MoE 模型（Thinking model）。

它在总参数量 16B、仅激活 1.4B 参数的情况下，即可达到 10B 级别以下 dense 模型的综合推理能力，尤其在逻辑推理、代码与数学任务中表现卓越，并支持 128K 长上下文及 300+ token/s 的高速生成。

Ring-mini-2.0 以 Ling-mini-2.0-base 为基础继续训练，经过 Long-COT SFT、更稳定持续的大规模 RLVR 以及 RLHF 联合优化，显著提升了复杂推理的稳定性与泛化性。在多项高难度基准（LiveCodeBench、AIME 2025、GPQA、ARC-AGI-v1 等）中，在输出长度相当的情况下，性能显著超越 10B 以下 dense 模型，甚至媲美更大参数量的 MoE 模型（如 gpt-oss-20B-medium），在逻辑推理方面尤为突出。

Ring-mini-2.0 已全面开源，模型权重、训练策略与数据配方将全部开放。

HuggingFace：https://huggingface.co/inclusionAI/Ring-mini-2.0
ModelScope：https://modelscope.cn/models/inclusionAI/Ring-mini-2.0

微信关注我们

原文链接：https://www.oschina.net/news/372966

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

蚂蚁百灵大模型团队开源 MoE 大模型 Ling-flash-2.0

蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型，Ling-flash-2.0 以总参数 100B、激活仅 6.1B（non-embedding 激活 4.8B）的轻量级配置，在多个权威评测中展现出媲美甚至超越 40B 级别 Dense 模型和更大 MoE 模型的卓越性能。据介绍，Ling-flash-2.0 在仅激活 6.1B 参数的前提下，实现了对 40B Dense 模型的性能超越，用最小激活参数，撬动最大任务性能。为此，团队在多个维度上 “做减法” 也 “做加法”： 1/32 激活比例：每次推理仅激活 6.1B 参数，计算量远低于同性能 Dense 模型专家粒度调优：细化专家分工，减少冗余激活共享专家机制：提升通用知识复用率 sigmoid 路由 + aux-loss free 策略：实现专家负载均衡，避免传统 MoE 的训练震荡 MTP 层、QK-Norm、half-RoPE：在建模目标、注意力机制、位置编码等细节上实现经验最优最终结果是：6.1B 激活参数，带来约 40B Dense...

2025-09-18

156

国务院新闻办公室今天（9月18日）下午举行 “高质量完成‘十四五’规划”系列主题新闻发布会，科技部负责人介绍“十四五”时期科技创新发展成就。据介绍，“十四五”时期，我国科技投入持续增加，2024年全社会研发投入超3.6万亿元，较2020年增长48%；研发投入强度达到2.68%，超过欧盟国家平均水平；研发人员总量世界第一。基础研究水平进一步提升。基础研究经费达2497亿元，较2020年增长超70%，在量子科技、生命科学、物质科学、空间科学等领域取得一批重大原创成果，高水平国际期刊论文数量和国际专利申请量连续5年世界第一。国家战略科技力量不断壮大。国家实验室体系建设稳步推进，国家科研机构、高水平研究型大学科研能力不断提升，科技领军企业加快培育成长。区域科技创新呈现良好态势。北京、上海、粤港澳大湾区国际科创中心支撑引领和辐射带动作用不断增强，深圳-香港-广州跃居全球百强创新集群榜首。成渝、武汉、西安区域科创中心建设加快推进。国家综合创新能力排名由2020年的第14位提升至2024年的第10位。

2025-09-18

88

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。