DeepSeekMath-V2 开源发布,世界首个奥数金牌 AI
据 Hugging Face 页面显示,深度求索 DeepSeek 团队发布了大语言模型 DeepSeekMath-V2,聚焦可自验证的数学定理证明能力,实现可自验证的数学推理突破。
该模型通过训练一个高精度、高保真的验证器,并以其作为奖励信号引导证明生成器自我修正,形成“生成—验证—优化”闭环。为应对生成与验证能力同步提升的挑战,团队提出扩展验证计算资源以自动标注难验证样本,持续优化验证器性能。
竞赛表现:
- IMO 2025:解决5题(83.3%准确率),达金牌水平;
- CMO 2024:获73.8%分数,达中国奥赛金牌线;
- Putnam 2024:118/120分,超越人类最高分(90分)。
在 IMO 2025、CMO 2024 和 Putnam 2024 等权威赛事中,DeepSeekMath-V2 表现卓越,分别取得金牌水平及118/120的近满分成绩。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型基于 DeepSeek-V3.2-Exp-Base 构建,已按 Apache 2.0 协议开源。
论文标题:DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning
模型地址:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
论文地址:https://github.com/deepseek-ai/DeepSeek-Math-V2/blob/main/DeepSeekMath_V2.pdf




