完美避坑！记一次 Elasticsearch 集群迁移架构实战-低调大师

完美避坑！记一次 Elasticsearch 集群迁移架构实战

2020-06-14 572

云栖号资讯：【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！

前言

Elastic 自身设计了集群分片的负载平衡机制，当有新数据节点加入集群或者离开集群，集群会自动平衡分片的负载分布。

需求背景

公司原有大数据平台基于公有云构建，由于种种原因，现在需要迁移到自建机房，Elasticsearch 集群承担了大数据平台主要的对外查询需求，也有部分实时计算需求基于 Elasticsearch 实现，所以需要在不影响应用系统体验的情况下做到平滑的迁移。本次分享讲述我们如何进行平滑迁移以及如何避坑。

需要迁移的主要有两部分：

对外提供的服务 API，这些 API 是与 Elastic 集群绑定的，属于业务场景定制化开发；
Elasticsearch 集群迁移，数据需要迁移，节点也需要全部迁移。

图示：公有云集群 + 自建机房集群示意图，业务系统查询图

迁移策略

大数据平台的 Elastic 集群直接对外提供实时查询服务，任何影响 Elastic 集群平稳的操作都应该避免，那我们的集群迁移策略也侧重平稳，时间上可以宽松一些，迁移主要的工作有以下几个：

关闭集群自动平衡；
启动自有机房新节点与公有云自建集群组成一个集群；
人工迁移集群数据到新节点；
外围访问切换到新节点；
关闭公有云节点；
开启集群自动平衡。

迁移步骤

迁移过程中有很多步骤操作，是有严格先后顺序的，如果出错则会造成集群动荡，影响应用体验。此时 Elastic 的版本是 6.5.X，当时最新的版本，迁移完成之后也全部升级到 6.8.X。

1、原有集群架构

图示：原有集群架构，数据节点与管理节点分离

1）Elasticsearch 节点有很多角色（管理节点、数据节点，协调节点），默认单节点常用角色全部开启。所以在早期搭建 Elastic 集群时，就按照角色分离的职责将管理节点与数据节点分离部署，这也是后面集群迁移能够顺利进行的重要前提。多数初学者在刚刚接触 Elastic 投入生产环境时会犯一个错误，节点角色不分离，当数据节点的资源消耗过度会导致集群管理节点响应变慢，从而影响整体集群响应。

#管理节点角色设置
 node.master: true
 node.data: false
#数据节点角色设置
 node.master: false
 node.data: true

2）Elastic 对外提供服务时中间会增加一层负载代理，如定制服务 API 与实时计算应用访问 Elastic 集群都需要走代理。

3）Hadoop 集群与 Elastic 集群互相访问是基于官方提供的 ES-Hadoop 驱动包，由于实现原理的限制，不能做代理，所以是直接访问，都是离线任务交互。

2、配置新集群

1）因为是迁移到新集群节点，原有节点最后都需要关闭，新集群节点同样也需要管理节点与数据节点分离，新旧节点需要平滑迁移，所以新旧节点在启动之后就需要在同一集群中，新节点 Hosts 同时指向新管理节点与旧管理节点，关键设置如下：

#配置管理节点 IP+PORT
discovery.zen.ping.unicast.hosts: [" 多个旧管理节点 IP:PORT"," 多个新管理节点 IP:PORT"]

2）新集群服务器采用的全部是物理机，CPU 核数很多，内存充足，挂载了多个硬盘，为了充分利用物理机性能，所以单服务器会部署多实例，主要是部署多个数据节点。在同一机器启动多个 Elastic 实例，需要做资源隔离，尤其是 CPU 核数隔离，CPU 的核数决定了 Elastic 默认线程池的线程数，如果不做设置，默认启动多个数据实例，会出现资源竞争问题，设置如下：

#配置处理器数量
processors: 数值 <=（CPU 核数 / 实例数）

3）公有云与自建机房直接通过专线连接，新旧集群节点在启动之后依然是一个集群。

图示：新旧集群示意图与多实例示意图

3、禁用集群数据平衡

Elasticsearch 集群有自动的数据分片平衡分配机制，默认是按照分片的数量平均分布，集群每个数据节点上的索引分片数量默认是相同的，最多有奇偶不一致。

当有新的带有数据角色节点加入集群或者离开集群，集群会默认启动自动平衡机制，索引分片会在数据节点之间平衡漂移，达到平均分布之后停止，频繁的集群节点加入或者下线会严重影响集群的 IO，影响集群响应速度，所以要尽量避免次情况发生。说到这里，在我的从业中，发现很多初级运维人员在部署 Elastic 集群时，会很喜欢设置系统级别 Elastic 实例进程自动启动，这个其实是个很糟糕的机制，当发现服务器 Elastic 实例关闭，不是马上重启，而是需要人工介入分析具体原因，如果频繁关闭重启，这样很容易造成集群问题。

1）第一个是禁用集群自动平衡，首先要禁止集群新创建索引，新索引之间分配到新的数据节点，其次防止新的数据节点启动之后，集群分片开始平衡迁移，影响集群 IO，设置如下：

#禁用集群新创建索引分配
cluster.routing.allocation.enable: false 
#禁用集群自动平衡
cluster.routing.rebalance.enable: false

2）第二个是限制已有索引数据的分布范围，暂时只容许分布在旧的数据节点上，旧集群数据节点在早期部署时并未设置自定义标签，所以只能通过设置 IP 范围限制，还有就是后面在迁移数据时需要按找索引维度逐步迁移，控制集群迁移的并行度。设置如下：

#限制索引的分布范围
"index.routing.allocation.include._ip": " 多个旧集群 IP"

4、启动新集群数据节点

在禁用旧集群的数据自动平衡之后，启动新集群数据节点，这一步是安全的，可以全部启动，此时集群数据节点有很多，旧数据节点有数据，新数据节点无数据，新的数据节点无任何查询与写入。

由于新数据节点是全新搭建，可以提前设置节点自定义属性，方便之后运维设置。设置如下：

#集群机架属性
node.attr.rack: rack1
#集群数据中心
node.attr.zone: zone1
#实例节点硬盘
node.attr.disk: ssd1
#更多属性......
node.attr.xxxx: yyy1
...

图示：仅优先启动数据节点

5、切换集群访问

Elasticsearch 集群主要有几个使用方：

1）Hadoop 平台离线数据写入 ES，从 ES 抽取数据。Elastic 提供了 Hadoop 直连访问驱动。如 Hive 是通过创建映射表与 Elasticsearch 索引关联的，新的数据节点启动之后，原有所有 Hive-Es 映射表需要全部重新创建，更换其中的 IP+PORT 指向；由于 Hive 有很多与 Elastic 关联的表，所以短时间内没有那么快替换完成，新旧数据节点需要共存一段时间，不能在数据迁移完成之后马上关闭。

#Hive 指定连接
es.nodes= 多个数据节点 IP+PORT

2）业务系统应用实时查询。这种切换比较简单，Elastic 集群对外提供了代理访问，业务系统应用访问首先要调用大数据提供的 API，这些定制化的 API 内部也是通过代理访问 Elastic 集群。

3）大数据中心应用实时计算数据写入。实时计算程序上游有 kafka 队列，基于 kafka 自带的 offset 机制，在新集群启动实时计算应用，然后关闭旧集群实时计算应用，就可以完成切换。

6、手动转移数据

为什么要手动迁移数据？

公有云与新集群机房是跨网段，网络带宽有限；
集群中有很多大索引，单索引数据超过数百 GB，这种索引移动会会很伤集群 IO；
新旧数据节点会共存一段时间，自动平衡会导致大量的跨网络的查询与写入，很伤网络 IO。

迁移数据的原则如下：

索引数据量小的优先；
离线更新的索引数据优先；
业务系统查询频率低索引数据的优先；
迁移索引数据控制并行度，每次操作控制在网络带宽限制之内。

迁移数据也是通过限制索引分布 IP 范围，设置如下：

#限制索引的分布范围
"index.routing.allocation.include._ip": " 多个新集群 IP"

7、关闭旧集群数据节点

关闭旧集群数据节点是一个逐步的过程，一个一个关闭，在一段时间内新旧集群数据节点需要共存，应用访问切换并没有那么快进行，且要支持随时回滚操作。关闭旧集群据节点有 2 个前提条件，如下：

旧集群索引数据必须迁移完成；
集群访问切换必须已经完成。

图示：关闭旧集群数据节点

8、启动新集群管理节点

为什么要在最后启动新集群管理节点？并且同步关闭旧集群管理节点？

一个 Elasticsearch 集群只有一个工作管理节点，负责维护集群所有的元数据信息；其余的是备选管理节点，只是同步集群元数据信息，不参与协调管理。工作主节点关闭集群需要重新选举工作主节点，此时集群会处于半停顿状态，虽然很快，也会有影响；
旧集群已经有 5 个管理节点，其中一个是工作主节点，其余 4 个是备选节点，因为 Elastic 版本是 6.5.X，原有的集群脑裂因子设置是 3=（5/2+1），当启动新集群的管理节点，若网络出现短暂通信问题，集群脑裂因子设置会无效。

切换新旧管理节点的策略如下：

每启动一个新集群管理节点，关闭一个旧集群备选管理节点；
最后关闭旧集群工作管理节点，集群重新选举新的工作管理节点。

图示：启动新集群管理节点

9、启用集群自动平衡

在集群迁移之前，已经禁用了集群的自动平衡机制，集群迁移结束之后，需要恢复这种机制。

#禁用集群新创建索引分配
cluster.routing.allocation.enable: true
#禁用集群自动平衡
cluster.routing.rebalance.enable: true

涉及技术

1、集群弹性

在我们能如此平滑的完成 Elasticsearch 从公有云迁移到自有机房，得益于与共用集群这个概念。

个人认为这是 Elasticsearch 最大特性卖点，设计上任意节点都可以很容易加入集群或者离开集群，集群都可以弹性的平滑扩展，基本不影响系统运行稳定；
在业务系统发展早期，可以部署少量节点，发展后期可以部署更多节点或者部署更强的服务器，以达到最佳的性价比配置，从成本与性能平衡；
自动化运维方面节约成本，相比传统的关系型数据库集群规模庞大之后，需要关注的点很多，而 Elastic 很少，大中型集群规模以下几乎无需专门的 Elastic 运维人员。

2、集群选举

主从架构模式，一个集群只能有一个工作状态的管理节点，其余管理节点是备选，备选数量原则上不限制。很多大数据产品管理节点仅支持一主一从，如 Greenplum、Hadoop、Prestodb；
工作管理节点自动选举，工作管理节点关闭之后自动触发集群重新选举，无需外部三方应用，无需人工干预。很多大数据产品需要人工切换或者借助第三方软件应用，如 Greenplum、Hadoop、Prestodb。

3、节点角色

Elasticsearch 支持多种节点角色，一个节点可以支持多个角色，也可以支持一种角色。

图示：集群节点角色

节点角色说明：

Master，管理节点，管理集群元数据信息，集群节点信息，集群索引元数据信息；
Voting，投票节点，参与集群管理节点选举投票，注意 7.X 以上版本才支持；
Data，数据节点，存储实际数据，提供初步联合查询，初步聚合查询，也可以作为协调节点；
Ingest，数据处理节点，类似 ETL 处理；
Coordinate，协调节点，数据查询协调、数据写入协调；
Machine Learning，机器学习节点，模型训练与模型预测。

4、协调路由

Elasticsearch 集群中有多个节点，其中任一节点都可以查询数据或者写入数据，集群内部节点会有路由机制协调，转发请求到索引分片所在的节点。我们在迁移集群时采用应用代理切换，外部访问从旧集群数据节点切换到新集群数据节点，就是基于此特点。

图示：集群路由示意图，查询过程 / 更新过程

5、分片副本

分片与副本是 Elasticsearch 集群实现分布式最重要前提。

分片机制，一个索引可以分成多个分片，分片数据可以分布在任意集群数据节点上，此机制可以保证我们迁移大的索引数据时，按照分片一个一个迁移，而不用一次性迁移所有的分片，有效减少磁盘 IO 与网络 IO；
副本机制，一个索引主分片可以有多个副本分片，主分片与副本分片可以任意切换，无需人工切换。这种机制可以保证我们在迁移大的数据索引时，仅迁移主分片数据即可，有效减少磁盘 IO 与网络 IO。

#副本设置
index.number_of_replicas: 数值，默认 1
 
#分片迁移 API
POST /_cluster/reroute
{
    "commands" : [
        {
            "move" : {
                "index" : "test_index", "shard" : 0,
                "from_node" : "node1", "to_node" : "node2"
            }
        }
    ]}

6、分布过滤

Elasticsearch 本身提供了多种索引分片分布过滤操作，特别是在集群规模比较大时，需要按照业务领域隔离集群资源。如有的业务索引是历史数据，数据量很大，仅偶尔低频率查询，可以做一些冷热分离设置。

# 分布过滤设置
index.routing.allocation.include.{attribute}
index.routing.allocation.require.{attribute}
index.routing.allocation.exclude.{attribute}

总结

Elastic 集群迁移到物理机之后，运行性能较之前有很大的提高，并行写入性能提升好几倍，查询与写入交叉影响降低很多；
Elastic 官方文档非常详细的描述了各种特性功能，但并没有针对数据迁移专门列举一个完整的步骤，掌握 Elastic 最好的方式是实战与理论并行，深入 Elastic 背后的实现原理，尝试多种项目的实战。

在跨越速运大数据部门任职时，基于公司实际需求，得出的一些经验与思考，提供后来者借鉴参考。

【云栖号在线课堂】每天都有产品技术专家分享！
课程地址：https://yqh.aliyun.com/live

立即加入社群，与专家面对面，及时了解课程最新动态！
【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间：2020-06-13
本文作者：dbaplus社群
本文来自：“infoq”，了解相关信息可以关注“infoq”

微信关注我们

原文链接：https://yq.aliyun.com/articles/765036

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

PHPOK 5.5.048 发布

增加：京东支付完善：核心文件（主要是针对 swoole 优化）完善：插件全局函数完善：表单系统增加会员组的调用修正：项目禁用后还显示统计新增：授权文件后缀图标升级方式：安装PHPOK5.5版后，直接在后台升级即可

2020-06-15

847

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！学习 HBase 最难的地方在于要让你的脑子真正理解它是什么。 HBase：Google BigTable 的开源实现我们经常会把关系型数据库（RDBMS，比如 MySQL）和 HBase 搞混，因为在这两个系统中都包含 table 和 base（HBase，Database）。这篇文章的目标是从概念上来说清楚 HBase 这个分布式的数据存储系统。读完后，你应该可以很清楚的知道什么情况下 HBase 更好，什么情况下传统的关系型数据库更好。关于一些术语幸运的是，Google 的 BigTable论文清楚的解释了 BigTable 到底是什么。下面是论文中数据模型章节的第一句话： BigTable 是一个稀疏的、分布式的、可持久化的多维有序 map。在这个节骨眼上，我想给读者一个机会，让他们在读到最后一行字时，能够收集到他们脑壳里的活动信息（这可能是个笑话，但我没懂^v^）。论文中，继续解释如下： map 通过 rowKey，columnKey 和时间戳进行索引，map 中的...

2020-06-14

688

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。