梁文锋等发表 DeepSeek V3 回顾性论文-低调大师

梁文锋等发表 DeepSeek V3 回顾性论文

2025-05-16 177

DeepSeek 创始人梁文锋等人近日发表了一篇名为《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for Al Architectures（深入了解DeepSeek-V3：人工智能架构硬件的扩展挑战与思考）》的回顾性论文。

深入分析了DeepSeek-V3/R1模型架构及其人工智能基础架构，重点介绍了一些关键创新，如提高内存效率的多头潜意识（MLA）、优化计算与通信权衡的混合专家（MoE）架构、释放硬件能力全部潜力的FP8混合精度训练，以及最大限度降低集群级网络开销的多平面网络拓扑结构。

该研究表明，当前大语言模型（LLM）的迅速扩展暴露了现有硬件架构的许多局限性，比如内存容量、计算效率和互连带宽。DeepSeek-V3在2048块 NVIDIA H800GPU 集群上训练，通过有效的硬件感知模型设计，克服了这些限制，实现了经济高效的大规模训练和推理。

具体来说，论文中提出了几个关键点。首先，DeepSeek-V3采用了先进的 DeepSeekMoE 架构和多头潜在注意力（MLA）架构，极大地提高了内存效率。MLA 技术通过压缩键值缓存，显著降低了内存使用，使得每个 token 只需70KB 的内存，相比其他模型大幅减少。

其次，DeepSeek 还实现了成本效益的优化。通过其混合专家（MoE）架构，DeepSeek-V3在激活参数的数量上实现了显著的降低，训练成本相比于传统密集模型降低了一个数量级。此外，该模型在推理速度上也进行了优化，采用双微批次重叠架构来最大化吞吐量，确保 GPU 资源得到充分利用。

DeepSeek 在未来硬件设计方面提出了创新的思考。他们建议通过联合优化硬件和模型架构，来应对 LLM 的内存效率、成本效益和推理速度三大挑战。这为日后的 AI 系统开发提供了宝贵的参考。

更多详情可查看具体论文：https://arxiv.org/pdf/2505.09343

微信关注我们

原文链接：https://www.oschina.net/news/350152

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Go 语言读写 Excel 基础库

Excelize 是 Go 语言编写的一个用来操作 Office Excel 文档类库，基于 ECMA-376 Office OpenXML 标准。可以使用它来读取、写入 XLSX 文件。相比较其他的开源类库，Excelize 支持写入原本带有图片(表)的文档，还支持向 Excel 中插入图片，并且在保存后不会丢失图表样式。安装 go get github.com/xuri/excelize/v2 创建 XLSX package main import ( "fmt" "github.com/xuri/excelize/v2" ) func main() { f := excelize.NewFile() // Create a new sheet. index := f.NewSheet("Sheet2") // Set value of a cell. f.SetCellValue("Sheet2", "A2", "Hello world.") f.SetCellValue("Sheet1", "B2", 100) // Set active sheet of the workb...

2025-05-15

158

MiniMax 现已推出基于 AR Transformer 模型的高质量 TTS 系统 ——MiniMax Speech 02。 MiniMax Speech 02 具有足够强的泛化能力，能够轻松驾驭 32 语种、不同口音、不同情绪的人声。该模型系统的核心创新之处在于其内在的 Zero-Shot 能力，其命为 Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder。在提供更优异听感同时，MiniMax Speech 02 做到了价格更低，分别是 ElevenLabs Flash V2.5 与 Mutilingual V2 的一半与四分之一。在国际权威的 Artificial Analysis 上，MiniMax Speech 02 也通过全球用户测评，位列全球第一。体验 MiniMax Speech https://www.minimax.io/audio https://www.minimaxi.com/audio 更多技术细节、实验对比数据、以及开源的多语言测试集，阅读技术报告 GitHub：ht...

2025-05-16

266

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。