SpaceX 自研 AI 训练栈 V1.0 接近完工：用 C 重写、适配 22 万块 GB300 GPU-低调大师

SpaceX 自研 AI 训练栈 V1.0 接近完工：用 C 重写、适配 22 万块 GB300 GPU

2026-05-28 49

马斯克在 X 上透露 SpaceX 团队已基本完成 V1.0 版本的自研 AI 训练栈开发。这套新系统以 C 语言编写，精确适配 22 万块 GB300 GPU 集群和 800G 网卡配置，在设计上大量采用流水线并行化，目标是尽可能接近裸金属性能。他给出的预期性能提升数字是：大规模训练任务相比 JAX 提速一个数量级以上。

这个信息的分量需要从几个维度来理解。首先，GB300 是 NVIDIA 最新的 GPU 架构之一，22 万块的集群规模意味着算力基础设施已经来到超级计算机级别。在如此规模的硬件上做训练栈，意味着团队必须在通信带宽、内存访问延迟和计算密度之间做出极其精细的工程权衡。用 C 语言而非 Python 或现有框架来实现，正是为了绕过高级语言带来的抽象开销。

其次，流水线并行（pipeline parallelism）是分布式训练中处理大模型的主流方案。其核心思路是将模型切分为多个阶段，每个设备负责一个阶段的计算，通过重叠通信和计算来隐藏数据传递的延迟。在 22 万块 GPU 的规模上实现高效的流水线并行，是一个工程难度极高的问题——规模越大，流水线气泡（pipeline bubble）的累积效应越严重，同步开销也越高。SpaceX 团队声称"尽可能接近裸金属"，暗示他们在这一层做了深度的内核级优化。

与 JAX 的比较是另一个值得关注的维度。JAX 是 Google 推出的高性能数值计算框架，在 AI 训练中广泛应用于大模型场景。SpaceX 认为自研栈相比 JAX 在大规模训练上存在"一个数量级以上"的提速。这个幅度的差异，来源并非算法层面，而是系统软件层面的优化——包括内存布局、计算调度、通信原语和 GPU 利用率等多个环节。

马斯克过去在 SpaceX 和 Tesla 的工程实践中多次展示过"掌握底层技术栈"的能力——从不锈钢火箭材料到自研芯片，“全垂直整合”（full vertical integration）是其核心工程哲学之一。在 AI 训练基础设施上从 JAX 切换到自研 C 栈，延续的是同一套逻辑：当市面通用方案无法满足极端场景的性能需求时，从底层重新设计是最直接的路径。

参考来源：X @elonmusk（https://x.com/elonmusk/status/2059884150187053488）

微信关注我们

原文链接：https://www.oschina.net/news/447347

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Anthropic 公布 Claude Code 近期响应速度与可靠性改进细节

Anthropic 官方开发者账号 ClaudeDevs 近日发布推文，透露 Claude Code 团队在过去一段时间集中投入了大量工作，旨在提升 AI 编码工具的响应速度与可靠性。结合 GitHub Releases 页面的公开信息，可以完整看到这批改进的具体内容。网络可用性是本轮改进的核心焦点。 v2.1.145 版本修复了一个长期困扰用户的顽疾：当 API 端点不可达时，Claude Code 启动时会挂起最多 75 秒——在 captive portal、防火墙或 VPN 环境下尤为突出。新版本将这个超时缩短至 15 秒，同时新增重试逻辑，大幅改善了边缘网...

2026-05-28

56

Krita 5.3.2 和 6.0.2 版本现已发布。此版本修复了文本工具的多个问题，并显著改进了 Selection Action Panel。此外，Android 现在会在后台处理资源复制，从而避免启动时常见的崩溃问题。以及修复了许多其他错误。【!WARNING】官方提醒称 Krita 5.3.2 适合生产性工作；6.0.2 由于从 Qt5 到 Qt6 的诸多变化，更适合实验性使用。修复传递给 GMic 的图层名称转换问题（Bug 517975）修复导入 .kra 文件作为图层时图层顺序颠倒的问题（Bug 514760）修复 Qt6 中的字体选择问题并改进字体下拉菜单。（Bug 5...

2026-05-28

45

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。