首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/385689

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

从技术突破到生态成型:DeepSeek 演讲要点解读

过去两年,大模型技术在全球范围内迎来快速演进,而 DeepSeek 的出现直接改变了行业的技术路径、成本结构以及开源生态的认知方式。回顾其从 2024 年初到 2025 年的迭代可以看到,模型性能、推理能力和工程效率均实现了跨越式提升。从 DeepSeek-LLM 的起步,到 V2 的大规模 MoE 架构,再到 V3 与 R1 在性能和推理上的突破,DeepSeek 成为推动开源大模型进入高性能、低成本时代的重要力量。 2025 年以来,DeepSeek 模型持续迭代。V3-0324、R1-0528、V3.1、V3.2-Exp 等版本的更新覆盖推理、代码能力、多语言能力、Agent 架构以及稀疏注意力等方向,反映出其在工程体系和算法路线上的持续探索。同时,OCR、Coder、Janus-Pro 以及 AI Infra 工具的开源,也不断拓展整个生态的技术边界。 DeepSeek 的影响不仅体现在技术层面。由于在高性能与低成本之间重塑了行业曲线,其开源模式、MIT 许可证、以及对国产算力的适配能力,使其在全球技术讨论中成为重要参照。R1 推理模型论文登上 Nature 封面,更标志着开源...

全球首个“纯 AMD”训练 MoE 大模型 ZAYA1 发布

AMD携手IBM与AI初创Zyphra发布ZAYA1——全球首个全程基于AMD硬件训练的MoE基础模型,预训练14T tokens,综合性能与Qwen3系列持平,数学/STEM推理未经指令微调即可逼近Qwen3专业版。 训练规模 集群:IBM Cloud128节点×8张AMD Instinct MI300X,共1024卡;InfinityFabric+ROCm,峰值750PFLOPs 数据:14T tokens,课程学习由通用网页→数学/代码/推理;后训练版本将另行发布 架构创新 CCA注意力:卷积+压缩嵌入注意力头,显存占用↓32%,长上下文吞吐↑18% 线性路由MoE:专家粒度细化+负载均衡正则,Top-2路由精度提升2.3pp,稀疏度达70%时仍保持高利用率 基准成绩 ZAYA1-Base(非指令版)在MMLU-Redux、GSM-8K、MATH、ScienceQA等基准与Qwen3-Base打平;CMATH与OCW-Math显著超越,验证STEM潜力。Zyphra透露,指令与RLHF版本将于2026Q1推出,并开放API与权重下载。 AMD表示,此次合作验证MI300X+ROC...

相关文章

发表评论

资源下载

更多资源
Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册