DeepSeek-V2 登上全球开源大模型榜首-低调大师

DeepSeek-V2 登上全球开源大模型榜首

2024-07-19 644

美国时间 2024年7月16日，LMSYS 组织的大模型竞技场（Chatbot Arena）更新结果发布，DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型，登上全球开源模型榜首。

Chatbot Arena 是全球公认的权威大模型盲测平台，吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与，更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测，评测者在不知晓模型名字和机构的情况下，让两个大模型回答同一个问题，选出更优质的回复。

DeepSeek-V2-0628 相较于 0507 开源 Chat 版本，在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com，接入最新版本 V2-0628 API。

DeepSeek-V2-0628 模型权重已经上传至：https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

DeepSeek-V2 是幻方量化旗下组织深度求索在今年 5 月份发布的第二代开源 MoE 模型，其优势包括：参数更多、能力更强、成本更低。

微信关注我们

原文链接：https://www.oschina.net/news/302881/deepseek-v2-0628-lmsys-leaderboard

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

英伟达全面转向开源 GPU 内核模块

借助 R515 驱动程序，英伟达于 2022 年 5 月发布了一套开源的Linux GPU 内核模块，该模块采用双许可证，即 GPL 和 MIT 许可。初始版本主要面向数据中心计算 GPU，而 GeForce 和工作站 GPU 则处于 Alpha 状态。当时，他们宣布在后续版本中将提供更可靠、功能齐全的 GeForce 和工作站 Linux 支持，NVIDIA 开放内核模块最终将取代闭源驱动。 NVIDIA GPU 具有通用的驱动架构和功能集。这意味着同一驱动适用于您的台式机或笔记本电脑，也可在云端运行世界上最先进的 AI 工作负载。两年过去了，英伟达利用开源的 GPU 内核模块实现了与原来的应用程序性能相当或更好的性能，并添加了大量新的功能。异构内存管理 (HMM) 支持机密计算 Grace 平台的连贯内存架构等等现在英伟达通过官方博客现在正式宣布，其开源内核模块最终将取代闭源驱动——目前正处于完全过渡到开源 GPU 内核模块的时刻。在即将发布的 R560 驱动版本中，他们将作出这一更改。英伟达称，对于 Grace Hopper 或 Blackwell 等平台，必须使用...

2024-07-19

402

外媒报道称，许多 Windows 用户在最近的 CrowdStrike 更新后遇到了蓝屏死机 (BSOD) 错误。该问题似乎很普遍，影响运行不同 CrowdStrike 版本的机器。在社交媒体上，全球不同地区的用户纷纷在抱怨这个突如其来的蓝屏死机错误。 CrowdStrike 已承认该问题，目前正在调查原因。CrowdStrike 发言人在论坛消息中表示：“我们意识到一个普遍存在的问题，导致 Windows 计算机出现 BSOD 错误。” 有人提供了针对此次蓝屏错误的临时解决方案：将c:\windows\system32\drivers\crowstrike 目录下的"crowstrike"文件夹重命名为其他名称。

2024-07-19

411

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。