CubeFS 2023 年度总结
CubeFS 在过去的一年中推出了许多新特性,特别是在可靠性和稳定性方面进行了大量修复和优化。与此同时,过去的一年也被称为大模型元年,CubeFS 为大模型推出了高性能客户端缓存,以支撑 AI 训练及混合云场景。值此新春佳节来临之际,我们对过去一年进行总结盘点,并展望未来一年的规划目标。
PART.1 产品迭代
在过去的一年中,CubeFS 社区共发布了三个版本,每个版本都有很多令人期待的变化。其中,3.2.1 版本和 3.3.0 版本的优化较大,修复了许多稳定性问题,并引入了一些重要的新特性,如原子性、配额、对象存储增强和纠删码架构简化。3.3.1 版本也推出了许多优化和实用的特性,比如回收站、服务端审计和垃圾清理工具。此外,这个版本还通过了 CNCF 的安全审计,在系统安全方面取得了重要进展。让我们来总结一下这些相关特性:
系统特性
- posix 接口原子性:统一解决分布式场景下数据、元数据多步多节点操作一致性问题,减少文件操作异常,提高可用性、可靠性。
- 回收站:解决经常出现的用户大规模误删除问题。
- 目录联合配额:解决如存储混用卷的目录统计进而解决容量限制、计费。
- 客户端缓存加速:AI 端侧公有云场景使用。
- 审计:客户端和服务端审计功能,追踪文件操作。
- 系统冻结(禁用卷):秒级响应业务,解决用户误操作、恶意操作。
纠删码子系统
- AzureLRC:支持 AzureLRC,AzureLRC+1 支持多机房坏 g+1 块盘的特性。
- Proxy 缓存:Proxy 缓存卷和磁盘信息(去除 memcache),Proxy 卷分配优化。
- Scheduler 支持 Kafka 消费组,支持可配置地并发批量删除 Blob。
- Blobnode Qos 磁盘限速优化,支持单盘读写线程限制。
- 优化数据巡检流程,支持动态调整速率、动态开关控制。
- 审计日志 Filter:审计日志新增功能更强的 Filter 过滤器。
对象子系统
- 兼容性增强:修复 S3 接口历史兼容性问题,提高 objnode 稳定性。
- CORS 功能:支持浏览器跨域功能。
- 权限管控:Bucket Policy、Bucket/Object ACL 权限管控特性。
- WORM 特性:对象删除保护功能。
- 重构签名算法:兼容 S3 V2 / V4 签名算法。
PART.2 社区发展
去年一年在主干的 commit 超过 1200+,同比增长 200%;issue 数量达到 400 左右,同比增长 100%;社区用户增长 50%,推出社区技术类文章 40 篇,组织月度例会 6 次,star 达到 4.2 K。
同时加强生态合作,与 fluid、osc 开源社区、soda 基金会等进行了不同形式的合作探索,同时这几年也在加强同社区的主力 committer 合作,京东、OPPO、BIGO、贝壳等都为社区提供了非常重要的特性和修复。
PART.3 用户情况
PART.4 生态建设
Helm 编排部署
CubeFS 支持在 AWS 的 EKS、Azure 的 AKS、GCP 的 GKE 以及阿里云的 ACK 上使用 Helm 的方式编排部署,包括以下组件:
- Master
- MetaNode
- DataNode
- ObjectNode
- csi
Operator 部署
为了更好地管理 CubeFS,提高效率、降低错误率,实现更高层次的自动化和自动化故障恢复,提供 CubeFS 的 Operator,主要功能包括:
- 集群的初始化部署
- 集群配置变更
- 集群版本升级
- 集群扩容
同时,Operator 也支持 AWS 的 EKS、Azure 的 AKS、GCP 的 GKE 以及阿里云的 ACK。
PART.5 官网优化
PART.6 后续规划
架构重构
- 存储引擎重构,提供 append only 文件系统,数据读写具有更低延时、更高吞吐。
- 混合云:混合云项目支持统一命名空间,提供混合使用多存储系统的能力,提供外部 S3、HDFS 能力。支持生命周期驱动数据在不同介质、存储类型、云上云下之间流动,降本增效。一期即将发版 。
稳定性、可靠性提升
- 磁盘 CRC 增强,提高主从同步、随机写等 CRC 校验能力。
- 磁盘自动化迁移,减少迁移过程元数据信息的原子性问题,提高运营自动化水平。
- 系统模块运营监控、告警加强,增强可观测性。
- 数据节点增加 learner 能力,支持同城多活部署。
性能提升
- 全链路加速,更好支撑数据库存算分离、AI 训练加速等场景。
- 客户端:提供内核客户端,并支持 GDS (GPU Direct Storage)、RDMA 技术,降低 IO 时延及 CPU 开销。
- 服务端:基于 RDMA 重建通信机制,从而整体上降低读写服务的延迟,提高吞吐能力。
- 分布式缓存:进一步优化分布式多级缓存架构,支持跨机房、跨云的读写加速能力,支撑 AI 训练加速需求。
- 优化现有系统基于 TCP 链路的读写能力。
- 优化客户端本地缓存 (一级缓存) 性能。
特性
- 基于 RocksDB 实现元数据存储,元数据全量缓存优化为按需缓存,降低内存开销。
- 纠删码子系统移除 Kafka 组件依赖,提供 SDK 供直接客户端直接接入,缩短数据传输路径。
- 提供事件通知特性、S3api QoS、objnode 审计日志功能、跨区域复制、QPS 及带宽计量计费能力。
CubeFS 简介
CubeFS 于 2019 年开源并在 SIGMOD 发表工业界论文,目前是云原生计算基金会 (CNCF) 托管的孵化阶段开源项目。作为新一代云原生分布式存储平台,兼容 S3、POSIX、HDFS 等协议,支持多副本和纠删码引擎,提供多租户,多 AZ 部署、跨区域复制等特性;适用于大数据、AI、容器平台、数据库及中间件存算分离,数据共享、数据保护等广泛场景。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
谷歌 Bard 更名为 Gemini,推出免费独立 APP
谷歌官方宣布,现已将旗下聊天机器人 Bard 更名为 Gemini,同时宣布多项内容升级: 谷歌测试版的聊天机器人 Bard(已接入 Gemini Pro 模型)改名 Gemini; 推出 Gemini 的 Android 版 App,并将 Gemini 的能力加入 iOS 的 Google App 中,免费向公众开放; 在 Android 上,用户可以选择使用 Gemini 可以替代原来的 Google Assistant,成为手机的默认语言助手; 在谷歌官方会员计划 Google One 中加入 Gemini Advanced 服务,多付 10 美元即可访问最强大的 Gemini Ultra 模型; 大模型能力很快将接入 Google Workspace(包括 Gmail、Docs、Meet 等应用)和 Google Cloud 中。 去年年底发布 Gemini 时,谷歌就表示其中最强大的 Ultra 模型将通过 Bard Advanced 提供,但尚无收费计划。 2 月,通过更名的 Gemini Advanced,Ultra 大模型正式对公众开放,不过,收费方案也随之而来。想要接...
- 下一篇
DevOps 选型指南:Zadig / 云效 / Coding/Jenkins/GitLab/Argo/Tekton
打造一个功能全面、稳定且用户体验友好的 DevOps 平台对于推动持续集成、持续交付、团队协作和效率提升至关重要。企业在选择 DevOps 平台时,有的倾向于采用平台类产品,如 Zadig、云效、Coding 等;而另一些企业则基于企业文化和项目需求,在已有的 CI/CD 工具(如 Jenkins、GitLab、Argo、Tekton)基础上自建 DevOps 平台,以实现对企业内部 DevOps 方案的定制。无论是选择平台类产品还是自建平台,都需要在搭建之前进行充分的规划和评估,以确保满足企业的需求并提升 DevOps 实践的效率。 本文将详细分析各个 DevOps 平台和工具的设计理念、特点、局限性等,并从多个维度(团队规模和业务复杂度、多云策略和厂商关联、使用场景和业务需求等)出发,结合企业实际的业务需求给出建议,为企业 DevOps 选型指明方向。 DevOps 平台类产品 Zadig Zadig 是由 KodeRover 公司基于 Kubernetes 研发的自助式云原生 DevOps 平台,服务端源码 100% 开放。Zadig 提供灵活可扩展的工作流支持、多种发布策略编...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G