Java分享

专注最优质的分享

热门搜索:

DeepSeek
Jdk25
ChatGPT
HarmonyOS NEXT
Nacos
SpringBoot
SpringCloud
Docker
K8s
服务网格
Redis

您现在的位置是：首页 > 文章详情

DeepSeek Coder V2 发布，首个击败 GPT-4 Turbo 的开源模型

日期：2024-06-19点击：687收藏

DeepSeek-Coder-V2 已正式上线和开源，沿用 DeepSeek-V2 的模型结构，总参数 236B，激活 21B，在代码、数学的多个榜单上位居全球第二，介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。

开源模型包含236B和16B两种参数规模：

DeepSeek-Coder-V2：总参 236B（即官网和 API 版模型），单机 8*80G 可部署，单机 8*80G 可微调（需要技巧）
DeepSeek-Coder-V2-Lite：总参 16B，激活 2.4B，支持 FIM，代码能力接近 DeepSeek-Coder-33B（V1），单卡 40G 可部署，单机 8*80G 可训练。

模型下载：https://huggingface.co/deepseek-ai

代码仓库：https://github.com/deepseek-ai/DeepSeek-Coder-V2

技术报告：https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf

在拥有世界前列的代码、数学能力的同时，DeepSeek-Coder-V2 还具有良好的通用性能，在中英通用能力上位列国内第一梯队。

DeepSeek-V2 是在今年 5 月份发布的一个开源 MoE 模型。公告指出，虽然 DeepSeek-Coder-V2 在评测中综合得分更高，但在实际应用中，两个模型各有所长。DeepSeek-V2 是文科生，DeepSeek-Coder-V2 是理科生，精通的技能点不同：

在 API 服务方面，DeepSeek-Coder-V2 API 支持 32K 上下文，价格和 DeepSeek-V2 一致：

相关阅读：

DeepSeek 发布全球最强开源 MoE 模型

原文链接：https://www.oschina.net/news/297904

关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有，本站原创内容转载请注明来源。

相关文章

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章