CNCF 技术监督委员会(TOC)已正式投票通过,接纳 Fluid 成为 CNCF 孵化级项目。
Fluid 是南京大学、阿里云与 Alluxio 社区联合推出的一个云原生数据编排与加速系统,Fluid 将“弹性数据集”视为一等资源,在 Kubernetes 环境中增加了一层数据抽象能力,从而提升面向数据密集型工作负载的数据流转与管理效率。
Fluid 的愿景可以概括为:Data Anyway, Anywhere, Anytime。目标是在云原生环境中为数据密集型 AI 应用提供高效、弹性、透明的数据访问能力。2021 年 5 月,Fluid 正式成为 CNCF Sandbox 项目。
![]()
目前,Fluid 已在全球多个行业和区域获得广泛采用,用户覆盖主要云服务商、互联网企业及垂直科技公司,包括小米、阿里巴巴、网易、中国电信、地平线、微博、哔哩哔哩、360、作业帮、小马智行、虎牙、OPPO、云知声、深势科技、聚宽等。
其应用场景也相当广泛,包括但不限于 AIGC、大模型、大数据、混合云、云上开发机管理以及自动驾驶数据仿真等。
Fluid 当前的核心组件包括:
- Dataset Controller:负责数据集抽象与管理,维护数据与底层存储之间的绑定关系和状态。
- Application Scheduler:感知数据缓存位置,并将应用 Pod 调度到最合适的节点上。
- Runtime Plugins:可插拔运行时接口,负责具体缓存引擎的部署、配置、扩缩容和故障恢复,具备很强的扩展性,可支持 Alluxio、JuiceFS、Vineyard 等多种引擎。
- Webhook:基于 Mutating Admission Webhook 机制,自动向应用 Pod 注入 sidecar 或 volume mount 信息,实现对应用零侵入。
- CSI Plugin:为应用 Pod 提供轻量、透明的数据集挂载能力,使其能够通过本地文件系统路径访问缓存数据或远程数据。
接下来,Fluid 将继续加强其在生成式 AI 和大数据场景中的数据编排能力。面向 GenAI 应用呈指数级增长的需求,Fluid 的下一步目标,是演进为一个智能弹性数据平台,让用户专注于模型创新和数据价值挖掘,而底层的数据分发、缓存加速、资源管理和弹性伸缩,则由 Fluid 负责完成。