DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
DeepSeek-R1 发布并同步开源模型权重。 DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 DeepSeek-R1 上线API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。 DeepSeek 官网与 App 即日起同步更新上线。 性能对齐OpenAI-o1正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 蒸馏小模型超越 OpenAI o1-mini 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 在发布并开源 R1 的同时,项目团队同步在协议授权层面也进行了如下调整: 模型开源 License 统一使用 MIT。开源仓库(...