GlusterFS更换故障Brick-低调大师

GlusterFS更换故障Brick

2017-03-21 708

1 前言

笔者公司内有一套GlusterFS分布式存储，最近数据分区的文件系统提示错误，群集有一个Brick需要替换掉。

基于稳妥操作的原则，笔者要先搭建测试环境并通过测试后才能在真实环境中执行，以下是笔者的测试文档，给有需要的博友参阅，另外笔者在发表本文时已经在生产环境通过验证。

服务器的故障日志（有修复文件系统方法的博友欢迎指教）：

cat /var/log/messages

可以看到如下信息：

Mar 21 14:58:04 GH01 kernel: XFS (dm-5): xfs_log_force: error 5 returned.

2 实践部分

2.1 环境信息

2.1.1 主机信息

GlusterH0[1-5]:

hostname=GlusterH0[1-5].cmdschool.org

ipaddress=10.168.0.19[1-5]

2.1.2 名称解析配置

In GlusterH0[1-6]

echo "10.168.0.191 GlusterH01.cmdschool.org GH01" >> /etc/hosts
echo "10.168.0.192 GlusterH02.cmdschool.org GH02" >> /etc/hosts
echo "10.168.0.193 GlusterH03.cmdschool.org GH03" >> /etc/hosts
echo "10.168.0.194 GlusterH04.cmdschool.org GH04" >> /etc/hosts
echo "10.168.0.195 GlusterH05.cmdschool.org GH05" >> /etc/hosts

2.1.3 配置YUM源

In GlusterH0[1-6]

yum install -y centos-release-gluster38

2.1.4 关闭防火墙

In GlusterH0[1-6]

/etc/init.d/iptables stop
chkconfig iptables off

2.2 配置数据存储根目录

In GlusterH0[1-5]

2.2.1 新建分区

fdisk /dev/sdb

详细向导如下：

Device contains neither a valid DOS partition table, nor Sun, SGI or OSF disklabel
Building a new DOS disklabel with disk identifier 0x089fd1ab.
Changes will remain in memory only, until you decide to write them.
After that, of course, the previous content won't be recoverable.

Warning: invalid flag 0x0000 of partition table 4 will be corrected by w(rite)

WARNING: DOS-compatible mode is deprecated. It's strongly recommended to
         switch off the mode (command 'c') and change display units to
         sectors (command 'u').

Command (m for help): n
Command action
   e   extended
   p   primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-26108, default 1): 
Using default value 1
Last cylinder, +cylinders or +size{K,M,G} (1-26108, default 26108): 
Using default value 26108

Command (m for help): w
The partition table has been altered!

Calling ioctl() to re-read partition table.
Syncing disks.

2.2.2 发现并校验

partx /dev/sdb
ls /dev/sdb*

2.2.3 创建文件系统

mkfs.xfs -i size=512 /dev/sdb1

2.2.4 配置挂载

mkdir -p /data
echo '/dev/sdb1 /data xfs defaults 1 2' >> /etc/fstab
mount -a && mount

2.3 配置glusterfs服务端

In GlusterH0[1-5] :

2.3.1 安装yum源

yum install -y glusterfs-server

2.3.2 启动服务

/etc/init.d/glusterd start
chkconfig glusterd on

2.4 配置信任池

In GlusterH01:

gluster peer probe GH02
gluster peer probe GH03
gluster peer probe GH04

显示如成功信息：

peer probe: success.

检查信任池状态

gluster peer status

显示如下：

Number of Peers: 3

Hostname: GH02
Uuid: e935be20-6157-4bc6-804b-a6901850211f
State: Accepted peer request (Connected)

Hostname: GH03
Uuid: d91cf978-71d7-4734-b395-fae7ccf4c040
State: Accepted peer request (Connected)

Hostname: GH04
Uuid: e05ea224-72f7-48c5-a73a-eeeb253d171d
State: Accepted peer request (Connected)

检查本与其他服务器的连接状态

netstat -antp | grep glusterd

显示如下：

tcp        0      0 0.0.0.0:24007               0.0.0.0:*                   LISTEN      1213/glusterd
tcp        0      0 10.168.0.191:24007          10.168.0.192:49150          ESTABLISHED 1213/glusterd
tcp        0      0 10.168.0.191:49149          10.168.0.193:24007          ESTABLISHED 1213/glusterd
tcp        0      0 10.168.0.191:24007          10.168.0.193:49149          ESTABLISHED 1213/glusterd
tcp        0      0 10.168.0.191:49151          10.168.0.192:24007          ESTABLISHED 1213/glusterd
tcp        0      0 10.168.0.191:49150          10.168.0.194:24007          ESTABLISHED 1213/glusterd
tcp        0      0 10.168.0.191:24007          10.168.0.194:49151          ESTABLISHED 1213/glusterd

注：以上可以看出本机与其他的每个brick都有两个TCP连接，一共6个。

2.5 配置GlusterFS卷

2.5.1 配置存储位置

In GlusterH0[1-4] :

mkdir -p /data/brick1/gv0

2.5.2 创建Gluster卷

In GlusterH01 :

gluster volume create gv0 replica 2 transport tcp GH01:/data/brick1/gv0 GH02:/data/brick1/gv0 GH03:/data/brick1/gv0 GH04:/data/brick1/gv0

显示如成功信息：

volume create: gv0: success: please start the volume to access data

2.5.3 启动GlusterFS卷

In GlusterH01 :

gluster volume start gv0

显示如成功信息：

volume start: gv0: success

2.5.4 验证卷的信息

In GlusterH01 :

gluster volume info

显示如下：

Volume Name: gv0
Type: Distributed-Replicate
Volume ID: cfea514c-cdce-4ae4-bcd9-bf56f4173271
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: GH01:/data/brick1/gv0
Brick2: GH02:/data/brick1/gv0
Brick3: GH03:/data/brick1/gv0
Brick4: GH04:/data/brick1/gv0
Options Reconfigured:
transport.address-family: inet
performance.readdir-ahead: on
nfs.disable: on

2.6 配置Gluster客户端

In GlusterH01 :

2.6.1 安装客户端相关包

yum install -y glusterfs-fuse

2.6.2 手动挂载卷gv0到本地

mount -t glusterfs GH01:/gv0 /mnt

2.7 测试Gluster卷

2.7.1 写入测试

In GlusterH01 :

for i in `seq -w 1 100`; do cp -rp /var/log/messages /mnt/copy-test-$i; done

2.7.2 写入确认

In GlusterH01 :

ls -lA /mnt/ | wc -l

In GlusterH0[1-4] :

ls -lA /data/brick1/gv0/

2.8 模拟brick故障

2.8.1 查看当前存储状态

In GlusterH01 :

gluster volume status

显示如下：

Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick GH01:/data/brick1/gv0                 49153     0          Y       1447
Brick GH02:/data/brick1/gv0                 49153     0          Y       1379
Brick GH03:/data/brick1/gv0                 49153     0          Y       1281
Brick GH04:/data/brick1/gv0                 49153     0          Y       1375
Self-heal Daemon on localhost               N/A       N/A        Y       1506
Self-heal Daemon on GH02                    N/A       N/A        Y       1440
Self-heal Daemon on GH04                    N/A       N/A        Y       1430
Self-heal Daemon on GH03                    N/A       N/A        Y       1430

Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

注：注意到Online项全部为“Y”

2.8.2 制造故障

In GlusterH01 :

vim /etc/fstab

注释掉如下行：

#/dev/sdb1 /data xfs defaults 1 2

重启服务器

reboot

2.8.3 查看当前存储状态

In GlusterH01 :

gluster volume status

显示如下：

Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick GH01:/data/brick1/gv0                 N/A       N/A        N       N/A
Brick GH02:/data/brick1/gv0                 49153     0          Y       1379
Brick GH03:/data/brick1/gv0                 49153     0          Y       1281
Brick GH04:/data/brick1/gv0                 49153     0          Y       1375
Self-heal Daemon on localhost               N/A       N/A        Y       1484
Self-heal Daemon on GH02                    N/A       N/A        Y       1453
Self-heal Daemon on GH03                    N/A       N/A        Y       1443
Self-heal Daemon on GH04                    N/A       N/A        Y       1444

Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

注：注意到GH01的Online项为“N”

注：文件系统故障，假设物理硬盘没有问题或已经更换阵列中的硬盘

2.9 恢复故障brick方法

2.9.1 结束故障brick的进程

In GlusterH01 :

gluster volume status

显示如下：

Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick GH01:/data/brick1/gv0                 N/A       N/A        N       N/A
Brick GH02:/data/brick1/gv0                 49153     0          Y       1379
Brick GH03:/data/brick1/gv0                 49153     0          Y       1281
Brick GH04:/data/brick1/gv0                 49153     0          Y       1375
Self-heal Daemon on localhost               N/A       N/A        Y       1484
Self-heal Daemon on GH02                    N/A       N/A        Y       1453
Self-heal Daemon on GH03                    N/A       N/A        Y       1443
Self-heal Daemon on GH04                    N/A       N/A        Y       1444

Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

注：如果状态Online项为“N”的GH01存在PID号（不显示N/A）应当使用如下命令结束掉进程方可继续下面步骤。

kill -15 pid

2.9.2 创建新的数据目录

In GlusterH01:

mkfs.xfs -i size=512 /dev/sdb1

编辑fstab

vim /etc/fstab

去掉注释：

/dev/sdb1 /data xfs defaults 1 2

重新挂载文件系统：

mount -a

增加新的数据存放文件夹（不可以与之前目录一样）

mkdir -p /data/brick1/gv1

2.9.3 查询故障节点的备份节点(gh02)目录的扩展属性

In GlusterH01:

ssh gh02 getfattr -d -m. -e hex /data/brick1/gv0

显示如下：

getfattr: Removing leading '/' from absolute path names
# file: data/brick1/gv0
security.selinux=0x756e636f6e66696e65645f753a6f626a6563745f723a686f6d655f726f6f745f743a733000
trusted.gfid=0x00000000000000000000000000000001
trusted.glusterfs.dht=0x0000000100000000000000007ffffffe
trusted.glusterfs.volume-id=0xcfea514ccdce4ae4bcd9bf56f4173271

2.9.4 挂载卷并触发自愈

In GlusterH01:

1）将卷挂到mnt目录下

mount -t glusterfs GH01:/gv0 /mnt

2）新建一个卷中不存在的目录并删除

mkdir /mnt/testDir001
rmdir /mnt/testDir001

3）设置扩展属性触发自愈

setfattr -n trusted.non-existent-key -v abc /mnt
setfattr -x trusted.non-existent-key /mnt

2.9.5 检查当前节点是否挂起xattrs

In GlusterH01:

1）再次查询故障节点的备份节点(gh02)目录的扩展属性

ssh gh02 getfattr -d -m. -e hex /data/brick1/gv0

发现如下：

# file: data/brick1/gv0
security.selinux=0x756e636f6e66696e65645f753a6f626a6563745f723a686f6d655f726f6f745f743a733000
trusted.afr.dirty=0x000000000000000000000000
trusted.afr.gv0-client-0=0x000000000000000200000002
trusted.gfid=0x00000000000000000000000000000001
trusted.glusterfs.dht=0x0000000100000000000000007ffffffe
trusted.glusterfs.volume-id=0xcfea514ccdce4ae4bcd9bf56f4173271

getfattr: Removing leading '/' from absolute path names

注：留意第4行,表示xattrs已经将源标记为gh02:/data/brick1/gv0

2）检查卷的状态是否显示需要替换

In GlusterH01:

gluster volume heal gv0 info

显示如下：

Brick GH01:/data/brick1/gv0
Status: Transport endpoint is not connected
Number of entries: -

Brick GH02:/data/brick1/gv0
/
Status: Connected
Number of entries: 1

Brick GH03:/data/brick1/gv0
Status: Connected
Number of entries: 0

Brick GH04:/data/brick1/gv0
Status: Connected
Number of entries: 0

注：状态提示传输端点未连接（第2行）

2.9.6 使用强制提交完成操作

In GlusterH01:

gluster volume replace-brick gv0 GH01:/data/brick1/gv0 GH01:/data/brick1/gv1 commit force

提示如下表示正常完成：

volume replace-brick: success: replace-brick commit force operation successful

注：也可以将数据恢复到另外一台服务器，详细命令如下（可选）：

gluster peer probe GH05
gluster volume replace-brick gv0 GH01:/data/brick1/gv0 GH05:/data/brick1/gv0 commit force

2.9.7 检查存储的在线状态

In GlusterH01:

gluster volume status

显示如下：

Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick GH01:/data/brick1/gv1                 49153     0          Y       1658
Brick GH02:/data/brick1/gv0                 49153     0          Y       1406
Brick GH03:/data/brick1/gv0                 49153     0          Y       1371
Brick GH04:/data/brick1/gv0                 49153     0          Y       1406
Self-heal Daemon on localhost               N/A       N/A        Y       1663
Self-heal Daemon on GH04                    N/A       N/A        Y       1703
Self-heal Daemon on GH03                    N/A       N/A        Y       1695
Self-heal Daemon on GH02                    N/A       N/A        Y       1726

Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

另外，如果更换到其他服务器状态显示如下：

Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick GH05:/data/brick1/gv0                 49152     0          Y       1448
Brick GH02:/data/brick1/gv0                 49153     0          Y       1270
Brick GH03:/data/brick1/gv0                 49153     0          Y       1328
Brick GH04:/data/brick1/gv0                 49153     0          Y       1405
Self-heal Daemon on localhost               N/A       N/A        Y       1559
Self-heal Daemon on GH02                    N/A       N/A        Y       1489
Self-heal Daemon on GH03                    N/A       N/A        Y       1479
Self-heal Daemon on GH04                    N/A       N/A        Y       1473
Self-heal Daemon on GH05                    N/A       N/A        Y       1453

Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

参阅文档

===================================

官方更换操作：

http://gluster.readthedocs.io/en/latest/Administrator%20Guide/Managing%20Volumes/#shrinking-volumes

微信关注我们

原文链接：https://blog.51cto.com/cmdschool/1908647

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Redis-3.2主从复制与集群搭建

一、Redis 主从搭建 1.下载并解压 yuminstall-ygccgcc-c++pcrezlibpcre-develtcl wgethttp://download.redis.io/releases/redis-3.2.4.tar.gz tar-zxvfredis-3.2.4.tar.gz cdredis-3.2.4 make cdsrc&&maketest&&makeinstall mkdir/etc/redis cp../redis.conf/etc/redis/redis.conf 2.系统参数调优 vim/etc/sysctl.conf net.core.somaxconn=20480#最大队列长度，应付突发的大并发连接请求，默认为128 net.ipv4.tcp_max_syn_backlog=20480#半连接队列长度，此值受限于内存大小，默认为1024 vm.overcommit_memory=1 0表示检查是否有足够的内存可用，如果是，允许分配；如果内存不够，拒绝该请求，并返回一个错误给应用程序。 1允许分配超出物理内存加上交换内存...

2017-03-20

663

Nginx搭建部署Web服务器并与NFS结合搭建负载均衡服务器一、搭建NginxWeb服务器此种方式是用yum安装Nginx，为保证安装成功需在安装之前提前安装epel扩展源。用yum安装Nginx 关闭系统防火墙查看Nginx配置文件安装完成后启动Nginx并查看其运行状态然后在客户端浏览器里面输入Nginx服务器的IP地址即可验证Nginx工作正常二、搭建NFS服务器 NFS：网络文件系统它允许网络中的计算机之间通过TCP/IP网络共享资源。在NFS的应用中，本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件，就像访问本地文件一样。三、使用nginx搭建反向代理服务器，并分别使用轮询、权重、及IP_hash的方式调度访问请求。四、nginx反向代理+三台web+nfs共享存储实现集群配置

2017-03-21

983

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。