您现在的位置是:首页 > 文章详情

蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0

日期:2025-09-18点击:54

蚂蚁百灵大模型团队正式发布 Ring-mini-2.0,一款基于 Ling-mini-2.0 架构深度优化的高性能推理型 MoE 模型(Thinking model)。

它在总参数量 16B、仅激活 1.4B 参数的情况下,即可达到 10B 级别以下 dense 模型的综合推理能力,尤其在逻辑推理、代码与数学任务中表现卓越,并支持 128K 长上下文及 300+ token/s 的高速生成。

Ring-mini-2.0 以 Ling-mini-2.0-base 为基础继续训练,经过 Long-COT SFT、更稳定持续的大规模 RLVR 以及 RLHF 联合优化,显著提升了复杂推理的稳定性与泛化性。在多项高难度基准(LiveCodeBench、AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,性能显著超越 10B 以下 dense 模型,甚至媲美更大参数量的 MoE 模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。

Ring-mini-2.0 已全面开源,模型权重、训练策略与数据配方将全部开放。

HuggingFace:https://huggingface.co/inclusionAI/Ring-mini-2.0
ModelScope:https://modelscope.cn/models/inclusionAI/Ring-mini-2.0

原文链接:https://www.oschina.net/news/372966
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章