Deploying and Scaling Logstash-低调大师

Deploying and Scaling Logstash

2017-11-07 506

elk+redis已是目前很多中小型公司比较青睐的开源日志搜集组合之一，主要是因为安装配置简单，社区活跃、开源免费等等.

随着公司业务的变多，日志量追渐增大，单节点的elk+redis已经满足不了业务的需求，这时候扩容或许是一件非常普遍的行为，那么如何做到自动扩容和"缩容"呢？

先来看一张简化版的扩谱图

在看完这张简化版的扩谱图之后，我们首先要明白elasticsearch cluster是如何做到Discovery的？

Elasticsearch是一个点对点的系统，节点之间直接通信并且节点之间的关系都是对等的；

2.0版本之后，为了安全考虑，默认禁用了multicast(组播)功能；但是Es还支持单播(unicast)方式

如果不涉及到Es性能优化，其实配置集群相当简单，只需要配置以下核心参数即可：

 
         discovery.zen.
         ping
         .unicast.hosts: [
         "10.100.100.81"
         , 
         "10.100.100.82"
         ] 
        
         # 指定Es集群中每个节点的host地址，集群中所有的配置保持一致.
        
         discovery.zen.minimum_master_nodes: 2
        
         # 指定master节点的个数（hosts / 2）+ 1
        
         # 这里的hosts是指集群节点数之和.

(1) Logstash插件介绍

 
         # logstash-shipping
        
         logstash-input-
         file     
         # 数据源. 
        
         logstash-output-redis   
         # 输出到消息队列. 
        
         # logstash-indexing
        
         logstash-input-redis    
         # 从消息队列中取数据. 
        
         logstash-output-elasticsearch   
         # 输入到elasticsearch 持久化存储.

(2) 为什么会有这个架构呢？

 
         2015.10 elk+redis(v1) 上线
        
         2016.5  elk+redis(v2) 方案已定(扩谱图)
        
         elk_v1 上线之后 研发使用后的反应很好.
        
         在elk_v1使用的过程中国区测试环境没有出过问题，但是美国正式环境就经常性问题不断？比如
        
         1> redis堵了；
        
         2> kibana界面打不开或者打开之后之后一直处于Searching状态，无法正常打开日志.
        
         3> kibana界面崩溃了
        
         4> es所在的机器cpu非常吃紧
        
         主要原因是因为美国正式环境日志量比中国测试环境日志量大的多，经过heap插件查看日志量在20~40G/天
        
         个人临时性的解决办法就是 elasticsearch集群；
        
         于是乎就
         "悄悄"
         的在美国正式环境上部署了一套3个节点的es集群，完成后告诉大领导，大领导回复 
        
         "3台实例比较贵，日志只是偶尔看."
         ，大领导想实现一种如果哪天日志量比较大的话我们就扩容，如果日志量小的我们就缩容 
        
         但是要保证日志尽可能不能丢失，因为我们使用的亚马逊的AWS费用比较昂贵.

(3) 如何实现动态扩容和缩容呢？

首先要明白elasticsearch集群的原理？

 
         logstash-output-elasticsearch
        
         hosts 类型为 数组 
        
         默认是本地的[
         '127.0.0.1'
         ] 
        
         假如你搭建了三个节点的elasticsearch集群，并指定master和node节点，这个时候我们只需要在
        
         output-elasticsearch插件做以下更改就可以了
        
         hosts => [
         "cluster-node1"
         , 
         "cluster-node2"
         , 
         "cluster-node3"
         ], 
        
         之后kibana连接任何一台elasticsearch就可以完整的查看所有数据.

(3.1) 基于以上原则我们做了改变，也就是上面的扩谱图.

 
         1. 每台要搜集日志的机器上都运行一个logstash-shipping服务
        
         并指定input插件为日志文件或日志文件目录
        
         而output插件就是消息队列redis、kafka、mq等
        
         2. 集群的任何一个节点上都运行logstash-indexing、redis、elasticsearch、kibana、haproxy服务.
        
         redis就是消息队列服务；
        
         logstash-indexing从消息队列中取数据并写入到elasticsearch；
        
         kibana从elasticserach查询数据；
        
         这里有两个问题要特别说明：
        
         1> elasticsearch如何自动建立集群的
        
         # Pass an initial list of hosts to perform discovery when new node is started:
        
         discovery.zen.ping.unicast.hosts:  [
         "127.0.0.1"
         , 
         "[::1]"
         ] 
        
         # Prevent the "split brain" by configuring the majority of nodes (total number of nodes / 2 + 1):
        
         discovery.zen.minimum_master_nodes: 2
        
         因为以上参数的都是动态可变的，因此选择用consul-
         template
         来自动更改，然后reload服务。 
        
         关于consul-
         template
         的一些高级用法可以参考官方文档，挺详细的 
        
         也可以私下交流  
        
         2> haproxy是代理什么服务？
        
         haproxy是对redis服务的代理；
        
         看以下几个参数
        
         logstash-output-redis host array # 解决队列的单点故障，可以同时指定多个redis实例.
        
         logstash-input-redis host string # 只能指定一个redis实例.
        
         如果output-redis指定的是多个redis实例，不能解决多个redis的请求、压力负载是均衡的，
        
         如果这里指定haproxy的代理redis实例的地址，用haproxy的负载均衡策略就可以解决
        
         redis负载不均衡的问题？

核心在于集群的每个节点上都要启动logstash-indexing、redis、elasticsearch、kibana、haproxy以上四个服务，elasticsearch和haproxy代理redis等这些动态的都是通过service discovery(consul)以及consul-template刷新完成的

单节点elk+redis性能架构瓶颈及解决办法？

 
         (1) Redis队列堵了？
        
         logstash-output-redis   
        
         data_type => list
        
         logstash的output插件到Redis，通常情况下我们指定的数据类型为list；
        
         如果你的App日志产生量在某一段时间内特别大，这个时候Redis有可能出现队列的长度几百万，这个
        
         时候你应该从哪里入手以及解决呢？从以下两点入手：
        
         1> 日志量不大，日志只写到Redis，但是不从Redis取，导致了只写不出.
        
         2> 日志量很大，日志量写的很快，但是从Redis取的很慢，导致了Redis每秒钟都在不停的增加.
        
         (2) 如何解决Redis队列堵了问题？
        
         增加线程数、增加往Es写入的频率和一次从Redis消费的数目
        
         flush_size 批量写入ES数量
        
         idle_flush_time 批量写入ES频率 
        
         (3) 如何动态监控redis队列？
        
         要注意监控redis队列长度，如果长时间堆集说明elk出问题了，要尽快解决否则Redis服务有可能会挂； 
        
         每2S检查一下redis中数据列表长度，100次 
        
         # redis-cli -r 100 -i 1 llen logstash:redis
        
         (4) 什么情况下要扩展到Es集群？
        
         观察过很长时间Es对cpu的影响比较大，内存往往都挺正常的；
        
         硬件配置4核cpu、8G内存；
        
         如果你登录kibana去查看日志，然后在登录到对应es的服务器上用
         top
         看服务器的性能，如果cpu 
        
         在300%左右或更高并且kibana界面一直处于Searching状态，那么建议你换Es集群吧！
        
         观察io也正常、内存也正常、就是cpu偶尔会很高.

 
        本文转自zys467754239 51CTO博客，原文链接：http://blog.51cto.com/467754239/1784253
   ，如需转载请自行联系原作者

微信关注我们

原文链接：https://yq.aliyun.com/articles/477617

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MapBalanceReduce介绍

目的： 1、从根本上解决reduce时的数据倾斜问题 2、从根本上解决基于优先级的并发调度问题 Map-Balance-Reduce (简称MBR)是在现有Map-Reduce模型基础之上的改进，以从根本上解决reduce倾斜问题，不用预先分析KEY的分布，编程接口在map和reduce之外，增加balance，但是只有在不均衡的时候balance才会被调用到。如果某个Split大于设定的值，则再分割，如果某个Split小于指定的值，则和其它的合并（只需要逻辑上的合并，不需要物理上合并，这样对性能不会有影响）。 Hadoop技术论坛：http://bbs.hadoopor.com 本文转自eyjian 51CTO博客，原文链接：http://blog.51cto.com/mooon/275492，如需转载请自行联系原作者

2017-11-08

696

0、前言时光荏苒，ES转眼间就从2.X跳到了5.X。。。忆往昔峥嵘岁月，奈何ES社区太活跃，版本跳的比房价还快啊。。。话说回来，需要部署一套Elasticsearch 5.2.1 即本月最新推出的ES新力作，发现很多用法已经不一样了。。。本次首先说Head插件的安装： 1、安装插件head 1 2 3 4 5 6 7 8 9 10 11 # 去github上下载head git clone git: //github .com /mobz/elasticsearch-head .git # 由于head基于nodejs所以安装它 yum -y install nodejs npm npm install grunt-cli npm install grunt grunt -version # 修改配置文件 cd elasticsearch- head vim _site /app .js # 修改『http://localhost:9200』字段到本机ES端口与IP 2、启动head 1 2 3 cd elasticsearch- head grunt server # ...

2017-11-08

644

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。