源码分析 RocketMQ DLedger 多副本存储实现
RocketMQ DLedger 的存储实现思路与 RocketMQ 的存储实现思路相似,本文就不再从源码角度详细剖析其实现,只是点出其实现关键点。我们不妨简单回顾一下 CommitLog 文件、ConsumeQueue 文件设计思想。
其文件组成形式如下:
正如上图所示,多个 commitlog 文件组成一个逻辑上的连续文件,使用 MappedFileQueue 表示,单个 commitlog 文件使用 MappedFile 表示。
温馨提示:如果想详细了解 RocketMQ 关于存储部分的讲解,可以关注笔者的《RocketMQ 技术内幕》一书。
1、DLedger 存储相关类图
1.1 DLedgerStore
存储抽象类,定义如下核心方法:
- public abstract DLedgerEntry appendAsLeader(DLedgerEntry entry)
向主节点追加日志(数据)。 - public abstract DLedgerEntry appendAsFollower(DLedgerEntry entry, long leaderTerm, String leaderId)
向从节点同步日志。 - public abstract DLedgerEntry get(Long index)
根据日志下标查找日志。 - public abstract long getCommittedIndex()
获取已提交的下标。 - public abstract long getLedgerEndTerm()
获取 Leader 当前最大的投票轮次。 - public abstract long getLedgerEndIndex()
获取 Leader 下一条日志写入的下标(最新日志的下标)。 - public abstract long getLedgerBeginIndex()
获取 Leader 第一条消息的下标。 - public void updateCommittedIndex(long term, long committedIndex)
更新commitedIndex的值,为空实现,由具体的存储子类实现。 - protected void updateLedgerEndIndexAndTerm()
更新 Leader 维护的 ledgerEndIndex 和 ledgerEndTerm 。 - public void flush()
刷写,空方法,由具体子类实现。 - public long truncate(DLedgerEntry entry, long leaderTerm, String leaderId)
删除日志,空方法,由具体子类实现。 - public void startup()
启动存储管理器,空方法,由具体子类实现。 - public void shutdown()
关闭存储管理器,空方法,由具体子类实现。
1.2 DLedgerMemoryStore
Dledger 基于内存实现的日志存储。
1.3 DLedgerMmapFileStore
基于文件内存映射机制的存储实现。其核心属性如下:
- long ledgerBeginIndex = -1
日志的起始索引,默认为 -1。
l- ong ledgerEndIndex = -1
下一条日志下标,默认为 -1。
- long committedIndex = -1
已提交的日志索引。 - long ledgerEndTerm
当前最大的投票轮次。 - DLedgerConfig dLedgerConfig
DLedger 的配置信息。 - MemberState memberState
状态机。 - MmapFileList dataFileList
日志文件(数据文件)的内存映射Queue。 - MmapFileList indexFileList
索引文件的内存映射文件集合。(可对标 RocketMQ MappedFIleQueue )。 - ThreadLocal< ByteBuffer> localIndexBuffer
本地线程变量,用来缓存索引ByteBuffer。 - ThreadLocal< ByteBuffer> localEntryBuffer
本地线程变量,用来缓存数据索引ByteBuffer。 - FlushDataService flushDataService
数据文件刷盘线程。 - CleanSpaceService cleanSpaceService
清除过期日志文件线程。 - boolean isDiskFull = false
磁盘是否已满。 - long lastCheckPointTimeMs
上一次检测点(时间戳)。 - AtomicBoolean hasLoaded
是否已经加载,主要用来避免重复加载(初始化)日志文件。 - AtomicBoolean hasRecovered
是否已恢复。
2、DLedger 存储 对标 RocketMQ 存储
存储部分主要包含存储映射文件、消息存储格式、刷盘、文件加载与文件恢复、过期文件删除等,由于这些内容在 RocketMQ 存储部分都已详细介绍,故本文点到为止,其对应的参考映射如下:
在 RocketMQ 中使用 MappedFile 来表示一个物理文件,而在 DLedger 中使用 DefaultMmapFIle 来表示一个物理文件。
在 RocketMQ 中使用 MappedFile 来表示多个物理文件(逻辑上连续),而在 DLedger 中则使用MmapFileList。
在 RocketMQ 中使用 DefaultMessageStore 来封装存储逻辑,而在 DLedger 中则使用DLedgerMmapFileStore来封装存储逻辑。
在 RocketMQ 中使用 Commitlog$FlushCommitLogService 来实现 commitlog 文件的刷盘,而在 DLedger 中则使用DLedgerMmapFileStore$FlushDataService来实现文件刷盘。
在 RocketMQ 中使用 DefaultMessageStore$CleanCommitlogService 来实现 commitlog 过期文件的删除,而 DLedger 中则使用 DLedgerMmapFileStore$CleanSpaceService来实现。
由于其实现原理相同,上述部分已经在《RocketMQ 技术内幕》第4章中详细剖析,故这里就不重复分析了。
3、DLedger 数据存储格式
存储格式字段的含义如下:
- magic
魔数,4字节。 - size
条目总长度,包含 Header(协议头) + 消息体,占4字节。 - entryIndex
当前条目的 index,占8字节。 - entryTerm
当前条目所属的 投票轮次,占8字节。 - pos
该条目的物理偏移量,类似于 commitlog 文件的物理偏移量,占8字节。 - channel
保留字段,当前版本未使用,占4字节。 - chain crc
当前版本未使用,占4字节。 - body crc
- 的 CRC 校验和,用来区分数据是否损坏,占4字节。
- body size
用来存储 body 的长度,占4个字节。 - body
具体消息的内容。
源码参考点:DLedgerMmapFileStore#recover、DLedgerEntry、DLedgerEntryCoder。
4、DLedger 索引存储格式
即一个索引条目占32个字节。
5、思考
DLedger 存储相关就介绍到这里,为了与大家增加互动,特提出如下两个思考题,欢迎与作者互动,这些问题将在该系列的后面文章专题探讨。
1、DLedger 如果整合 RocketMQ 中的 commitlog 文件,使之支持多副本?
2、从老版本如何升级到新版本,需要考虑哪些因素呢?
原文发布时间为:2019-09-01
本文作者:丁威,《RocketMQ技术内幕》作者。
本文来自中间件兴趣圈,了解相关信息可以关注中间件兴趣圈。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
CMU 15-721 14-数据库调度 Scheduling
查询执行 查询计划是由运算符组成的,而运算符实例就是操作符运算在一段数据上的一次调用,任务就是一系列这样的操作符实例的执行序列。 数据库调度 对于每一个查询计划,数据库系统需要决定什么时候,在什么地方,怎么样去执行。→ 应该使用多少个任务?→ 应该使用多少个CPU核?→ 任务应该在哪个CPU核上执行?→ 任务应该将它的输出存储到哪里?数据库系统永远要比操作系统知道这些。 今天我们来讲一下: 进程模型 数据放置 数据库调度 进程模型 数据库系统中的进程模型定义了一个系统架构,可以支撑多用户应用的并发请求。Worker是数据库的一个组件,负责代表客户端执行任务并返回结果。 1: 一个进程一个Worker 2: 进程池 3: 一个线程一个Worker 一个进程一个Worker 每一个Worker就是一个独立的OS进程→ 依赖于OS系统调度→ 对全局数据结构使用共享内存。→ 进程崩溃不会让整个系统崩溃。→ 例子: IBM DB2, Postgres, Oracle 进程池 一个Worker可以使用任意进程池中空闲的进程。→ 仍然依赖于OS系统调度和共享内存。→ 不利于 CPU 缓存的局部性.....
-
下一篇
Spring Cloud Alibaba实战(一) - 概述
1 什么是Spring Cloud Alibaba ◆ 阿里巴巴结合自身微服务实践,开源的微服务全家桶◆ 在Spring Cloud项目中孵化,很可能成为Spring Cloud第二代的标准实现◆ 在业界广泛使用,已有很多成功案例 Github issue :使用的公司及场景 2 应用场景 ◆ 大型复杂的系统例如大型电商系统◆ 高并发系统 例如大型门户网站,商品秒杀系统◆ 需求不明确,且变更很快的系统例如创业公司业务系统 3 Spring Cloud Alibaba和Spring Cloud 的区别和联系 SpringCloud Alibaba是SpringCloud的子项目,SpringCloud Alibaba符合SpringCloud标准比较SpringCloud第一代与SpringCloud Alibaba的优势,如下如: 3 将学到
相关文章
文章评论
共有0条评论来说两句吧...