etcd实现故障时主备秒级切换高可用架构
什么是Etcd?
etcd是一个强大的一致性的分布式键值存储,它提供了一种可靠的方式来存储需要由分布式系统或机器群访问的数据。它优雅地处理网络分区期间的领导者选举,并且可以容忍机器故障,即使在领导者节点中也是如此。从简单的Web应用程序到Kubernetes,任何复杂的应用程序都可以读取数据并将数据写入etcd。这是官方对Etcd的描述,基于这些特性,Etcd常用于分布式配置、分布式锁、分布式服务协调者以及分布式注册。从功能上来说和zookeeper是一类项目,但是相比而言etcd更现代,etcd使用go语言开发,编译后生成了系统可执行的二进制产物,跨平台性更好,更易维护。etcd直接提供http的接口,非常方便各大语言封装自己的client sdk,在易用性方面也更好一点。下面也主要使用java的客户端jetcd,解决主备服务的协调问题。
etcd项目地址:https://github.com/etcd-io/etcd
etcd官网:https://etcd.io
jetcd地址:https://github.com/etcd-io/jetcd
主备服务场景描述
很多时候为了服务的高可用,除了有个在工作的主服务外,还需要多启用几个备用服务,这样,在主服务出现故障时,备用服务能够马上顶上。这个场景有个很明显的特征就是同一时间只能有一个主服务。常见的如mysql主从切换等,同一时间只能有一个msyql负责写数据。在我们这边的场景是,有一个binlog解析服务,实时解析mysql 的binlog,将解析到的数据传递到kafka中,kafka消费端有一个Flink job去消费解析的数据。最终这些数据会下层到数据中台中,提供给中台系统做基础的业务数据。很多在线的服务查询的数据就是来源binlog解析的数据,所以binlog解析的服务不能存在单点故障,在架构上只能是一主多备的模式,主服务故障时,备用服务实时顶上。同时binlog服务也不能同时多个解析。所以,这个场景使用etcd来做主备架构再好不过了。
jetcd具体实现
首先引入jetcd依赖
<dependency> <groupId>io.etcd</groupId> <artifactId>jetcd-core</artifactId> <version>0.3.0</version> </dependency>
初始化客户端
Client client = Client.builder().endpoints( "http://127.0.0.1:2379", "http://127.0.0.1:3379", "http://127.0.0.1:4379" ).build();
关键api介绍
Lock lock = client.getLockClient(); Lease lease = client.getLeaseClient();
- Lease提供授予,撤销和保持租约的方法,其中有两个关键方法grant(long ttl)和keepAlive()。grant用于授予租约,入参为租约的时间,即如果创建带租约的key值,ttl秒后即自动删除,返回租约的id。keepAlive()方法用于保持租约有效,即如果租约即将到期时,keepAlive能够自动续租ttl时间。
- Lock有两个方法,lock(ByteSequence name, long leaseId)和unlock(ByteSequence lockKey)。来实现分布式锁的功能,其中加锁时,入参leaseid为续约对象的id,即定义了持有锁的时间
通过这Lease和Lock的功能,很容易实现主备服务的切换。关键代码如下:
ByteSequence lockKey = ByteSequence.from("/root/lock", StandardCharsets.UTF_8); Lock lock = client.getLockClient(); Lease lease = client.getLeaseClient(); long leaseId = lease.grant(lockTTl).get().getID(); lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() { @Override public void onNext(LeaseKeepAliveResponse value) { System.err.println("LeaseKeepAliveResponse value:" + value.getTTL()); } @Override public void onError(Throwable t) { t.printStackTrace(); } @Override public void onCompleted() { } }); lock.lock(lockKey, leaseId).get().getKey();
- 首先申请授予续约获取到leaseId,其中lockttl为1,单位秒,etcd的租约是秒级的。在这里ttl的设置是有讲究的,取决于当主服务故障时,你想多快让从服务感知并顶上。当然,受限于etcd本身租约秒级限制,最快也只能是1秒。
- 然后调用keepAlive方法,使授予到的leaseid保活,这样,只要应用还存活就会自动续约
- 接着调用lock方法,传入leaseid。只有首次启动的服务会获取到锁,而且在运行期间,会不断的续约。当从服务运行到此处时,会阻塞住。这样就能保证多个服务同时运行,只有一个服务真正工作的目的。当获取到锁的主服务出现问题时,原先的只有锁的续约在1秒内就会到期,从服务会马上获取到锁执行工作代码
完整的测试用例
/** * @author: kl @kailing.pub * @date: 2019/7/22 */ public class JEtcdTest { private Client client; private Lock lock; private Lease lease; //单位:秒 private long lockTTl = 1; private ByteSequence lockKey = ByteSequence.from("/root/lock", StandardCharsets.UTF_8); private ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(2); @Before public void setUp() { client = Client.builder().endpoints( "http://127.0.0.1:2379", "http://127.0.0.1:3379", "http://127.0.0.1:4379" ).build(); lock = client.getLockClient(); lease = client.getLeaseClient(); } @Test public void lockTest1toMaster() throws InterruptedException, ExecutionException { long leaseId = lease.grant(lockTTl).get().getID(); lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() { @Override public void onNext(LeaseKeepAliveResponse value) { System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL()); } @Override public void onError(Throwable t) { t.printStackTrace(); } @Override public void onCompleted() { } }); lock.lock(lockKey, leaseId).get().getKey(); scheduledThreadPool.submit(() -> { while (true) { System.err.println("我是主服务开始工作了"); TimeUnit.SECONDS.sleep(1); } }); TimeUnit.DAYS.sleep(1); } @Test public void lockTest2toStandby() throws InterruptedException, ExecutionException { long leaseId = lease.grant(lockTTl).get().getID(); lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() { @Override public void onNext(LeaseKeepAliveResponse value) { System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL()); } @Override public void onError(Throwable t) { t.printStackTrace(); } @Override public void onCompleted() { } }); lock.lock(lockKey, leaseId).get().getKey(); scheduledThreadPool.submit(() -> { while (true) { System.err.println("我是备用服务,我开始工作了,估计主服务已经挂了"); TimeUnit.SECONDS.sleep(1); } }); TimeUnit.DAYS.sleep(1); } @Test public void lockTest3toStandby() throws InterruptedException, ExecutionException { long leaseId = lease.grant(lockTTl).get().getID(); lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() { @Override public void onNext(LeaseKeepAliveResponse value) { System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL()); } @Override public void onError(Throwable t) { t.printStackTrace(); } @Override public void onCompleted() { } }); lock.lock(lockKey, leaseId).get().getKey(); scheduledThreadPool.submit(() -> { while (true) { System.err.println("我是备用服务,我开始工作了,估计主服务已经挂了"); TimeUnit.SECONDS.sleep(1); } }); TimeUnit.DAYS.sleep(1); } }
上面测试用例模拟了一主两备的高可用架构。分别执行lockTest1toMaster()、lockTest2toStandby()、lockTest3toStandby()服务,会发现只有一个服务会打印。然后手动关闭这个服务,从服务马上会接着打印。在关闭这个从服务,另外一个从服务就会接着打印。很好的模拟了主备故障切换的效果
作者简介:
陈凯玲,2016年5月加入凯京科技。现任凯京科技研发中心架构组经理,救火队队长。独立博客KL博客(http://www.kailing.pub)博主。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
一文了解JVM
一、什么是JVM JVM是Java Virtual Machine(Java 虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。 Java语言的一个非常重要的特点就是平台无关性。而使用Java虚拟机是实现这一特点的关键。一般的高级语言如果要在不同的平台上运行,至少需要编译成不同的目标代码。而引入Java语言虚拟机后,Java语言在不同平台上运行时不需要重新编译。Java语言使用Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。这就是Java的能够“一次编译,到处运行”的原因。 二、JVM总体概述 JVM总体上是由类装载子系统(ClassLoader)、运行时数据区、执行引擎、垃圾收集这四个部分组成。其中我们最为关注的运行时数据区,也就是JVM的内存部分则是由方法区(Method Area)、JAVA堆(Java Heap)、虚拟机栈(JVM...
- 下一篇
正交分析法设计理论及实践
一、理念介绍 在黑盒用例设计方法中有一个大家耳熟能详的正交分析法,却鲜有人知 “Pairwise”设计理念。 设想一种常见的场景,工期很紧的项目,原定的测试时间被“无理”地压缩之后,如何能用极少的时间去保证更高的质量呢? 举个例子,如果让你测试一下word字体效果,你会整理出多少个用例呢? 答案很简单是2的七次方=128个用例,但当工期特别紧的时候(128个用例执行不完)你又会从中选取哪些用例来执行呢? “Pairwise”(官网: http://www.pairwise.org/)是行之有效的一个思路或者是强有力的理论基础。它是L. L. Thurstone(29 May1887 – 30 September 1955)在1927年首先提出来的。他是美国的一位心理统计学家。Pairwise也正是基于数学统计和对传统的正交分析法进行优化后得到的产物。 Pairwise基于如下2个假设: (1)每一个维度都是正交的,即每一个维度互相都没有交集。 (2)根据数学统计分析,73%的缺陷(单因子是35%,双因子是38%)是由单因子或2个因子相互作用产生的。19%的缺陷是由3个因子相互作用产生的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8编译安装MySQL8.0.19
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 设置Eclipse缩进为4个空格,增强代码规范
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- MySQL8.0.19开启GTID主从同步CentOS8