DeepSeek V3.1-Base 开源发布
DeepSeek 最新开源模型 V3.1-Base 已上架 HuggingFace,相关信息如下: 模型参数为 685B 基座模型(Base),用于微调和二次开发 基于 DeepSeek V3 架构,包含自定义代码实现 混合精度设计,支持 BF16、FP8(E4M3)、FP32 张量类型 支持 FP8 量化,提升推理效率 采用 Safetensors 安全张量格式 详情查看https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base


