DeepSeekMath-V2 开源发布,世界首个奥数金牌 AI
据 Hugging Face 页面显示,深度求索 DeepSeek 团队发布了大语言模型 DeepSeekMath-V2,聚焦可自验证的数学定理证明能力,实现可自验证的数学推理突破。 该模型通过训练一个高精度、高保真的验证器,并以其作为奖励信号引导证明生成器自我修正,形成“生成—验证—优化”闭环。为应对生成与验证能力同步提升的挑战,团队提出扩展验证计算资源以自动标注难验证样本,持续优化验证器性能。 竞赛表现: IMO 2025:解决5题(83.3%准确率),达金牌水平; CMO 2024:获73.8%分数,达中国奥赛金牌线; Putnam 2024:118/120分,超越人类最高分(90分)。 在 IMO 2025、CMO 2024 和 Putnam 2024 等权威赛事中,DeepSeekMath-V2 表现卓越,分别取得金牌水平及118/120的近满分成绩。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型基于 DeepSeek-V3.2-Exp-Base 构建,已按 Apache 2.0 协议开源。 论文标题:DeepSeekMath-V2: T...
