DeepSeek-V2 登上全球开源大模型榜首
美国时间 2024年7月16日,LMSYS 组织的大模型竞技场(Chatbot Arena)更新结果发布,DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型,登上全球开源模型榜首。
Chatbot Arena 是全球公认的权威大模型盲测平台,吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与,更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测,评测者在不知晓模型名字和机构的情况下,让两个大模型回答同一个问题,选出更优质的回复。
DeepSeek-V2-0628 相较于 0507 开源 Chat 版本,在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com,接入最新版本 V2-0628 API。
DeepSeek-V2-0628 模型权重已经上传至:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628
DeepSeek-V2 是幻方量化旗下组织深度求索在今年 5 月份发布的第二代开源 MoE 模型,其优势包括:参数更多、能力更强、成本更低。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
英伟达全面转向开源 GPU 内核模块
借助 R515 驱动程序,英伟达于 2022 年 5 月发布了一套开源的Linux GPU 内核模块,该模块采用双许可证,即 GPL 和 MIT 许可。初始版本主要面向数据中心计算 GPU,而 GeForce 和工作站 GPU 则处于 Alpha 状态。 当时,他们宣布在后续版本中将提供更可靠、功能齐全的 GeForce 和工作站 Linux 支持,NVIDIA 开放内核模块最终将取代闭源驱动。 NVIDIA GPU 具有通用的驱动架构和功能集。这意味着同一驱动适用于您的台式机或笔记本电脑,也可在云端运行世界上最先进的 AI 工作负载。 两年过去了,英伟达利用开源的 GPU 内核模块实现了与原来的应用程序性能相当或更好的性能,并添加了大量新的功能。 异构内存管理 (HMM) 支持 机密计算 Grace 平台的连贯内存架构 等等 现在英伟达通过官方博客现在正式宣布,其开源内核模块最终将取代闭源驱动——目前正处于完全过渡到开源 GPU 内核模块的时刻。在即将发布的 R560 驱动版本中,他们将作出这一更改。 英伟达称,对于 Grace Hopper 或 Blackwell 等平台,必须使用...
- 下一篇
Crowdstrike 更新导致全球 Windows 大面积蓝屏死机
外媒报道称,许多 Windows 用户在最近的 CrowdStrike 更新后遇到了蓝屏死机 (BSOD) 错误。 该问题似乎很普遍,影响运行不同 CrowdStrike 版本的机器。在社交媒体上,全球不同地区的用户纷纷在抱怨这个突如其来的蓝屏死机错误。 CrowdStrike 已承认该问题,目前正在调查原因。CrowdStrike 发言人在论坛消息中表示:“我们意识到一个普遍存在的问题,导致 Windows 计算机出现 BSOD 错误。” 有人提供了针对此次蓝屏错误的临时解决方案:将c:\windows\system32\drivers\crowstrike 目录下的"crowstrike"文件夹重命名为其他名称。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7设置SWAP分区,小内存服务器的救世主