DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
深度求索正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。
作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价,欢迎广大用户体验测试并向我们反馈意见。
DeepSeek Sparse Attention(DSA)
稀疏注意力机制
DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
为了严谨地评估引入稀疏注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。
论文链接 & 模型开源
DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源:
- HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
- ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
论文也已同步公开:
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
TileLang & CUDA 算子开源
在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。我们使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。在最后阶段,以 TileLang 作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含 TileLang 与 CUDA 两种版本。我们建议社区在进行研究性实验时,使用基于 TileLang 的版本以方便调试和快速迭代。
API 支持
得益于新模型服务成本的大幅降低,官方 API 价格也相应下调,新价格即刻生效。
在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。
目前 API 的模型版本为 DeepSeek-V3.2-Exp,访问方式保持不变。欢迎用户使用 DeepSeek 官方的 API 服务。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
🔥磐石 panshi 单体 spring boot 开发框架 1.1.2 版本发布
项目介绍 爱组搭 panshi 磐石~稳定可靠的 Web 开发框架。 使用必须遵守国家法律法规,⛔不允许非法项目使用,后果自负❗ 愿景:每个人都是架构师 出处:《荀子・劝学》“锲而不舍,金石可镂” 官方文档点击这里 1,默认 `aizuda-framework` 部分已经发布到中央仓库,可以不需要本地打包安装。 2,只需要启动:后端 `aizuda-panshi` 前端 `aizuda-panshi-ui` 更详细查看官方文档。 升级日志 opt: 优化 bom 包管理依赖 opt: ORM 相关及 MybatisPlus 版本修改为非强制依赖 feat: apache 工具包 commons-lang3 升级为 3.19.0 版本 feat: spring boot 版本升级为 3.5.6 feat: spring doc 版本升级为 2.8.13 部分界面效果 系统首页 菜单管理
-
下一篇
Linux 6.17 正式发布,带来了大量硬件支持与性能优化
Linux Kernel6.17 已正式发布,并将成为未来 Ubuntu 25.10、Fedora 43 等发行版的重要内核基础。 https://lkml.org/lkml/2025/9/28/461 此次更新带来了大量硬件支持与性能优化: Attack Vector Controls — 提升安全性方面的控制机制增强 Intel Panther Lake Xe3 显卡 被宣布为稳定支持(stable),意味着该硬件在内核中的驱动成熟可靠 Intel 图形驱动改进,特别是为 “Project Battlematrix” 的相关支持增强 Raspberry Pi RP1 的主线支持 被纳入(mainline support)——硬件支持更广泛 Intel IPU7 驱动 的加入/优化 EXT4 文件系统的可扩展性改进 各种性能优化和其他系统级优化(如调度、内存、驱动方面的调整) 开发者测试显示,Linux 6.17 运行稳定,并带来一定性能提升。随着该版本发布,Linux 内核进入 6.18 的合并窗口,新一轮功能更新即将展开。
相关文章
文章评论
共有0条评论来说两句吧...