DeepSeek Coder V2 发布,首个击败 GPT-4 Turbo 的开源模型
DeepSeek-Coder-V2 已正式上线和开源,沿用 DeepSeek-V2 的模型结构,总参数 236B,激活 21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。
开源模型包含236B和16B两种参数规模:
-
DeepSeek-Coder-V2:总参 236B(即官网和 API 版模型),单机 8*80G 可部署,单机 8*80G 可微调(需要技巧)
-
DeepSeek-Coder-V2-Lite:总参 16B,激活 2.4B,支持 FIM,代码能力接近 DeepSeek-Coder-33B(V1),单卡 40G 可部署,单机 8*80G 可训练。
在拥有世界前列的代码、数学能力的同时,DeepSeek-Coder-V2 还具有良好的通用性能,在中英通用能力上位列国内第一梯队。
DeepSeek-V2 是在今年 5 月份发布的一个开源 MoE 模型。公告指出,虽然 DeepSeek-Coder-V2 在评测中综合得分更高,但在实际应用中,两个模型各有所长。DeepSeek-V2 是文科生,DeepSeek-Coder-V2 是理科生,精通的技能点不同:
在 API 服务方面,DeepSeek-Coder-V2 API 支持 32K 上下文,价格和 DeepSeek-V2 一致:
相关阅读:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Karmada v1.10 发布,新增多集群声明式负载重平衡
本文分享自华为云社区《Karmada v1.10 - 多集群声明式负载重平衡》,作者:云容器大未来。 Karmada 是开放的多云多集群容器编排引擎,旨在帮助用户在多云环境下部署和运维业务应用。凭借兼容 Kubernetes 原生 API 的能力,Karmada 可以平滑迁移单集群工作负载,并且仍可保持与 Kubernetes 周边生态工具链协同。 在最新发布的v1.10版本中,Karmada新增了工作负载重平衡功能:在某些场景下,资源副本的当前分布状态可能不是最优,但调度器为了减少对系统的冲击会尽可能保持调度结果的惰性,不会轻易改变调度结果;此时,用户可以通过新引入的 WorkloadRebalancer API 针对指定的资源手动触发全新的重调度,以在集群间建立最优的副本状态分布。 本版本其他新增特性: 解除资源模板名称长度不能超过 63 个字符的限制 生产环境中的可用性和可靠性增强 新特性概览 Workload Rebalance 一般情况下,工作负载类资源一旦被调度,其调度结果通常会保持惰性,不会轻易改变副本分布状态。即使通过修改资源模板中的副本数或PropagationPol...
- 下一篇
苹果或许在 2024 年底推出 M4 MacBook Pro 机型
根据 9to5mac 的报道,苹果可能打算在 2024 年底前,给 MacBook Pro 系列电脑升级到 M4 芯片,这消息是根据 OLED 屏幕的生产计划推测出来的。 到现在为止,M4 芯片只用在了一款产品上,那就是最新的 iPad Pro 系列。但如果分析师预测准了,MacBook Pro 也很快就要用上这款芯片了。 显示器分析师 Ross Young 称他最近查看了供应链的信息,采用 M4 芯片的 MacBook Pro 机型预计将于 2024 年第四季度推出。 Young 在给订阅用户的推文中说,14 英寸和 16 英寸 MacBook Pro 新机型的面板出货将于 2024 年第三季度开始。如果这消息属实,这表明新机型将于今年年底推出,正好赶上年末购物季。 不过,Ross Young 的说法和另一位知名分析师 Mark Gurman 的观点有点出入。Gurman 在 4 月份说过,M4 芯片的 MacBook Pro 可能不会在 2024 年底发布,而是要等到 2025 年初。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境