ES[7.6.x]学习笔记（一）Elasticsearch的安装与启动-低调大师

ES[7.6.x]学习笔记（一）Elasticsearch的安装与启动

2020-02-25 540

Elasticsearch是一个非常好用的搜索引擎，和Solr一样，他们都是基于倒排索引的。今天我们就看一看Elasticsearch如何进行安装。

下载和安装

今天我们的目的是搭建一个有3个节点的Elasticsearch集群，所以我们找了3台虚拟机，ip分别是：

192.168.73.130
192.168.73.131
192.168.73.132

然后我们要下载ES，这里我们采用的版本是7.6.0。我们进入到/opt目录下，下载elasticsearch7.6.0

curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.6.0-linux-x86_64.tar.gz

下载的过程比较慢。下载完成后，我们解压：

tar -zxvf elasticsearch-7.6.0-linux-x86_64.tar.gz

在启动elasticsearch之前，这里有一个重点：ES在启动的时候是不允许使用root账户的，所以我们要新建一个elasticsearch用户：

useradd elasticsearch

然后把elasticsearch-7.6.0这个目录和目录下所有的文件的拥有者都改成elasticsearch:

chown elasticsearch:elasticsearch -R elasticsearch-7.6.0

然后，我们切换到elasticsearch用户：

su - elasticsearch

我们将ES安装在/opt目录下，先进入到/opt目录，

cd /opt/elasticsearch-7.6.0

我们启动一下，看看单机版能不能启动成功。

./bin/elasticsearch

可以启动成功。但是我们通过浏览器访问这个ip的9200端口时，是不成功的。我们需要对elasticsearch进行配置，才可以在别的机器上访问成功。

ES的配置

es的所有配置文件都在${ES_HOME}/config这个目录下，首先我们设置一下jvm参数，打开jvm.options文件，

vim jvm.options

################################################################
## IMPORTANT: JVM heap size
################################################################
##
## You should always set the min and max JVM heap
## size to the same value. For example, to set
## the heap to 4 GB, set:
##
## -Xms4g
## -Xmx4g
##
## See https://www.elastic.co/guide/en/elasticsearch/reference/current/heap-size.html
## for more information
##
################################################################

# Xms represents the initial size of total heap space
# Xmx represents the maximum size of total heap space

-Xms256m
-Xmx256m

我们改一下堆内存的大小，我这里使用的虚拟机，只分配了1g的内存，所以，我这里统一调整为256m内存，大家可以根据自己机器的内存情况进行调整。

然后，我们再打开elasticsearch.yml文件，配置一下这里边的参数。

# ======================== Elasticsearch Configuration =========================
#
# NOTE: Elasticsearch comes with reasonable defaults for most settings.
#       Before you set out to tweak and tune the configuration, make sure you
#       understand what are you trying to accomplish and the consequences.
#
# The primary way of configuring a node is via this file. This template lists
# the most important settings you may want to configure for a production cluster.
#
# Please consult the documentation for further information on configuration options:
# https://www.elastic.co/guide/en/elasticsearch/reference/index.html
#
# ---------------------------------- Cluster -----------------------------------
#
# Use a descriptive name for your cluster:
#
cluster.name: cluster-a
#
# ------------------------------------ Node ------------------------------------
#
# Use a descriptive name for the node:
#
node.name: node-130
#
# Add custom attributes to the node:
#
#node.attr.rack: r1
#
# ----------------------------------- Paths ------------------------------------
#

我们先配置一下集群的名字，也就是cluster.name，在这里，我们叫做cluster-a。在另外两台机器上，集群的名字也要叫做cluster-a，这样才能够组成一个集群。在ES中，集群名字相同的节点，会组成ES集群。

然后，我们再修改node.name节点名称，这个名称是每一个节点的，所以，每个节点的名称都不能相同。这里我们以ip命名，130这台机器，节点名称就叫node-130，另外两台叫做node-131和node-132。

我们再接着看后面的配置，

# ----------------------------------- Paths ------------------------------------
#
# Path to directory where to store the data (separate multiple locations by comma):
#
#path.data: /path/to/data
#
# Path to log files:
#
#path.logs: /path/to/logs
#
# ----------------------------------- Memory -----------------------------------
#
# Lock the memory on startup:
#
#bootstrap.memory_lock: true
#
# Make sure that the heap size is set to about half the memory available
# on the system and that the owner of the process is allowed to use this
# limit.
#
# Elasticsearch performs poorly when the system is swapping the memory.
#
# ---------------------------------- Network -----------------------------------
#
# Set the bind address to a specific IP (IPv4 or IPv6):
#
network.host: 192.168.73.130
#
# Set a custom port for HTTP:
#
#http.port: 9200

路径和内存，咱们使用默认的就好，咱们重点看一下网络。我们需要指定一下ES绑定的地址，如果不设置，那么默认绑定的就是localhost，也就是127.0.0.1，这样就只有本机能够访问了，其他机器是访问不了的。所以这里我们要绑定每台机器的地址，分别是192.168.73.130，192.168.73.131，192.168.73.132。

接下来，我们看一下集群的相关配置，

# --------------------------------- Discovery ----------------------------------
#
# Pass an initial list of hosts to perform discovery when this node is started:
# The default list of hosts is ["127.0.0.1", "[::1]"]
#
discovery.seed_hosts: ["192.168.73.130", "192.168.73.131","192.168.73.132"]
#
# Bootstrap the cluster using an initial set of master-eligible nodes:
#
cluster.initial_master_nodes: ["node-130", "node-131", "node-132"]
#
# For more information, consult the discovery and cluster formation module documentation.
#

也就是Discovery这一段的配置，我们先设置一下集群中节点的地址，也就是discovery.seed_hosts这一段，我们把3台机器的ip写在这里。然后再把3台机器的节点名称写在cluster.initial_master_nodes，好了，集群的配置到这里就告一段落了。

系统配置

接下来我们再看看重要的系统配置。在ES的官网上，有这样一句话，

Ideally, Elasticsearch should run alone on a server and use all of the resources available to it.

翻译过来是，合理的做法是，ES应该在一个服务中单独运行，并且可以使用这个机器中所有的可用资源。

只要你在配置文件中配置了network.host，ES就认为你将发布生产环境，如果你的一些配置不正确，那么ES就不会启动成功。在这里，ES也要求我们对系统的一些配置做出修改。

ulimit调整

首先，我们要修改Linux系统的文件打开数，将其调到65535。

su -
ulimit -n 65535 
exit

然后再修改limits.conf文件，我们同样切换到root用户，打开limits.conf文件，

vim /etc/security/limits.conf

在文件的最后添加elasticsearch - nofile 65535，然后保存退出。

关闭swapping

其次，在ES的官方文档上，要求Disabled Swapping ，我们要关掉它。执行以下命令：

sudo swapoff -a

这只是临时的关闭swapping，重启linux后，会失效。如果要永久的关闭swapping，需要编辑/etc/fstab文件，将包含swap的行的注释掉。

/dev/mapper/centos-root /                       xfs     defaults        0 0
UUID=6a38540f-2ba9-437b-ac8b-8757f5754fff /boot                   xfs     defaults        0 0
# /dev/mapper/centos-swap swap                    swap    defaults        0 0

调整mmapfs的数值

由于ES是使用mmapfs存储索引，但是系统的默认值太低了，我们调高一点。

sysctl -w vm.max_map_count=262144

线程的数量

确保elasticsearch用户最少可创建4096个线程。我们还是要以root用户去设置。

su -
ulimit -u 4096

同样，这知识临时的方案，linux重启后会失效，我们需要修改配置文件/etc/security/limits.conf，将nproc设置为4096。

elasticsearch  -  nproc 4096

好，到这里我们所有的配置就完成了，现在依次启动3个节点的ES。启动完成后，我们在浏览器中检查以下集群的状态，http://192.168.73.130:9200/_cluster/health，

{"cluster_name":"cluster-a","status":"green","timed_out":false,"number_of_nodes":3,"number_of_data_nodes":3,"active_primary_shards":0,"active_shards":0,"relocating_shards":0,"initializing_shards":0,"unassigned_shards":0,"delayed_unassigned_shards":0,"number_of_pending_tasks":0,"number_of_in_flight_fetch":0,"task_max_waiting_in_queue_millis":0,"active_shards_percent_as_number":100.0}

我们看到status是green。说明我们的ES集群搭建成功了。

微信关注我们

原文链接：https://yq.aliyun.com/articles/746610

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

菜鸟供应链实时数仓的架构演进及应用场景

摘要：在 Flink Forward Asia 大会实时数仓专场中，菜鸟数据&规划部高级数据技术专家贾元乔从数据模型、数据计算、数据服务等几个方面介绍了菜鸟供应链数据团队在实时数据技术架构上的演进，以及在供应链场景中典型的实时应用场景和 Flink 的实现方案。首先从三个方面简要介绍一下菜鸟早在 2016 年采用的实时数据技术架构：数据模型、实时计算和数据服务。数据模型。菜鸟最初使用的是需求驱动的、纵向烟囱式的开发模式，计算成本高且完全没有复用的可能性，同时也会导致数据一致性的问题；整个数据模型没有分层，业务线内部模型层次混乱，使得数据使用成本特别高。实时计算。该部分使用的是阿里的 JStorm 和 Spark Streaming，大多数情况下，二者可以满足实时计算的需求，但是对于有些复杂的功能，如物流和供应链场景，实现起来不够简单，开发成本较高；同时很难兼顾功能、性能、稳定性以及快速的故障恢复能力。数据服务。数据主要存储在 Hbase、MySQL 和 ADB 等不同类型的数据库中，然而对于很多运营人员来说，查询数据库的频率并不高，但使用数据库的成本较高，尤其针对一些 ...

2020-02-25

824

云栖号案例库：【点击查看更多上云案例】不知道怎么上云？看云栖号案例库，了解不同行业不同发展阶段的上云方案，助力你上云决策！公司介绍公司地址：武汉东湖新技术开发区光谷大道41号现代·国际设计城一期3栋24层01、02号行业分布:文化案例分类:在线教育业务痛点 TimingApp未设置专职运维人员，此前采用单体PHP架构，无法满足快速增长的业务需求。今年，开始尝试开源项目，自建微服务架+APM，但因技术门槛和人力不足一直没有成功落地。业务本身具有潮汐特性，用户访问主要集中在晚间和节假日，此外，受疫情影响，春节期间峰值流量暴增4倍，面临快速响应和成本上的压力。痛点综述：代码耦合度较高、微服务架构运维复杂、开发迭代效率较低、资源利用率不高解决方案解决方案逻辑图方案细节阿里云Serverless应用引擎（简称SAE）基于Serverless架构，屏蔽了底层IaaS运维和K8s细节，区别于FaaS形态的Serverless产品，用户无需修改编程模型，零代码改造就能直接使用。同时，完美结合SpringCloud/Duboo等微服务架构，提供应用发布、管理和服务治理等应用全生命周期的服务。...

2020-02-25

879

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。