浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司共同联合开发了迄今为止最大且最强大的开源医疗语言模型:AntAngelMed。
核心亮点
- 权威评测全球领先:在 OpenAI 的 HealthBench 评测上,AntAngelMed 超越所有开源模型及一系列顶尖闭源模型;在中国权威评测 MedAIBench 上,综合排名第一。
- 专业的医疗能力:AntAngelMed 通过严谨的三阶段训练流程(医疗语料持续预训练、高质量指令精调以及基于 GRPO 的强化学习),铸就了其专业的医疗能力。该训练流程为模型赋予了深厚的医学知识、复杂的诊疗推理能力以及强大的安全与伦理对齐能力。
- 极致的推理效率:基于 Ling-flash-2.0 的高效 MoE 架构,AntAngelMed 以 100B 的总参数量,仅激活 6.1B 参数即可达到约 40B 稠密模型的性能水平。它在 H20 硬件上推理速度超过 200 tokens/s,并支持 128K 上下文窗口。
AntAngelMed 在 HealthBench 的开源模型中排名第一:
![]()
据介绍,AntAngelMed 采用了三阶段训练流程:
- 首先,通过持续预训练对通用基座模型 Ling-flash-2.0-base 注入大规模、高质量的医学语料,构建了深厚的医疗知识底蕴;
- 随后,在监督微调阶段,通过多源异构的高质量指令数据,一方面强化了模型的通用核心思维链,另一方面针对医患问答、诊断推理等真实医疗场景进行深度适配;
- 最后,AntAngelMed 采用先进的 GRPO 强化学习算法,并通过双阶段强化学习路径对模型能力进一步优化提升:首先以 “推理强化学习” 锻造其逻辑推理的核心能力,再以 “通用强化学习” 打磨其同理心与安全边界意识,最终实现了医疗专业性与人文关怀的高度统一。
![]()
团队还为专为 AntAngelMed 进行推理加速,采用 FP8 量化 + EAGLE3 优化,在 32 并发场景下,推理吞吐量较 FP8 显著提升:在 HumanEval 提升 71%,GSM8K 提升 45%,Math-500 提升高达 94%,实现了推理性能与模型稳定性的深度平衡。
HuggingFace:https://huggingface.co/MedAIBase/AntAngelMed
ModelScope:https://modelscope.cn/models/MedAIBase/AntAngelMed
Github: https://github.com/MedAIBase/AntAngelMed/tree/main