干掉一堆mysql数据库，仅需这样一个shell脚本-低调大师

干掉一堆mysql数据库，仅需这样一个shell脚本

2019-04-03 739

一大早就被电话吵醒了，云某项目数据库全挂了，启动不了（睡得太死，没听到报警短信），吓得不轻啊！

电话中说所有mysql数据库主库都启动不了，但从库正常，怀疑是主库去连其它阿里云的主库了。这些数据库，以前是从阿里云迁移到idc机房的，因此他有这个判断。

赶紧打开电脑，连***，登录其中一个数据库服务器，试着执行如下命令启动mysql服务

[root@bbsmysql121 backup]#mysqld_safe –user=mysql &

启动失败，又换一台数据库服务器尝试，还是失败。考虑到所有的数据库都不能启动，因此可以初步判定，可能是数据库宿主机的问题导致的。

数据库的底层设计是两台物理节点虚拟化，外加一台物理机做备份。其中一台物理机的虚拟机全部做mysql主库，另一台物理机的虚拟机做mysql从库。

先放弃在虚拟机进行故障排查，赶紧登录宿主机系统。接下来，从两个方面排查问题所在。

ü 虚拟化后台管理系统

发现存储被塞满了，问题很严重。

ü ssh登录宿主系统debian

[6885005.756183] Buffer I/O error on dev dm-16, logical block 34667776, lost async page write

[6885005.757292] Buffer I/O error on dev dm-16, logical block 34667792, lost async page write

[6885005.758210] Buffer I/O error on dev dm-16, logical block 34667808, lost async page write

[6885005.759079] Buffer I/O error on dev dm-16, logical block 34667824, lost async page write

[6885005.759922] Buffer I/O error on dev dm-16, logical block 34667840, lost async page write

[6885005.760723] Buffer I/O error on dev dm-16, logical block 34667856, lost async page write

系统日志/var/log/messages发现大量的磁盘io错误。

综合上述发现，基本可以断定是磁盘出了问题：一个问题是proxmox划定的存储空间被塞满，另一个是磁盘io错误。知道问题所在以后，接下来的处理方案有两个：修复错误或者把从库提升为主库。考虑到待机问题，还是尽量争取修复主库吧，实在不能修复，再用第二套方案（提升从库）。

释放磁盘空间

为什么磁盘空间会塞满呢？应该有人在虚拟机上干了啥，而且可能是每个虚拟机都进行相同的操作，才会导致宿主机磁盘空间迅速填满。随便登录某个运行mysql数据库的虚拟机，执行命令

df -h

再登其它服务器，分区/dev/sdb1也是使用了90%以上。进入目录/data，运行如下指令查看目录空间占用情况：

[root@cumysql121 data]# du -hs *
4.0K backup
59G db_pkg
59G mysql_db
[root@cumysql121 data]# cd backup
[root@cumysql121 backup]# du -hs *

好家伙，好几个50多G的目录（写这个文章时，我已经删掉了，没有留存记录），这些文件，从目录名称上看，应该是备份数据库自动生成的。不管它，先删除。

肯定有人在系统做了自动任务，用指令crontab –l 查看，果然有发现：

#!/bin/bash
/usr/local/xtrabackup/bin/innobackupex --defaults-file=/etc/my.cnf --user=root --passwor='+N4dohask+MsLhG' /data/backup/
find /data/backup/* -mtime +1 -exec rm -fr {} \;
~

初一看这个脚本没什么问题，再仔细看，最后一行是符号“~”,有问题啊！写脚本的人的意图是每天进行一次备份数据库备份，然后删除前一天的历史备份数据，这样就不会把磁盘塞满了。

但是这有两个致命的问题，这里分别描述之。

备份策略错误

有专门的备份系统，应该把数据备份到该系统上，而不是本地备份。

手段错误

备份脚本写好以后，应该手动执行，以验证其正确性。而不是写完，直接扔在上边不管。

修复磁盘错误

紧急联系机房，请技术人员把KVM over 连接到宿主机，万一系统引导不了，可远程查看或者进入单用户模式进行 fsck一类的修复操作。

Ssh连宿主机系统debian，确认被塞满的磁盘空间被释放，然后执行reboot重启系统。几分钟以后，系统正常引导。

后续操作

查看系统日志，没有磁盘io报错，创建目录及文件，正常；启动各虚拟机、启动其上的数据库，都正常了。

通知各路人马，从业务层面检查是否正常。片刻，短信来一堆恢复信息，心里踏实多了。不用说，是项目方的sa干的这个好事，并且没有通知任何人。

私下给他说，这事自己跟其它人解释，以后干有风险的事情，最好相互通知一下。

微信关注我们

原文链接：https://blog.51cto.com/sery/2373667

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

看Spring Data如何简化数据操作

Spring Data 概述 Spring Data 用于简化数据库访问，支持NoSQL 和关系数据存储，其主要目标是使数据库的访问变得方便快捷。SpringData 项目所支持 NoSQL 存储：MongoDB （文档数据库）Neo4j（图形数据库）Redis（键/值存储）Hbase（列族数据库）SpringData 项目所支持的关系数据存储技术：JDBCJPA Spring Data JPA JPA Spring Data : 致力于减少数据访问层 (DAO) 的开发量. 开发者唯一要做的，就只是声明持久层的接口，其他都交给 Spring Data JPA 来帮你完成！开发步骤配置 Spring 整合 JPA 在 Spring 配置文件中配置 Spring Data，让 Spring 为声明的接口创建代理对象，配置了 \<jpa:repositories> 后，Spring 初始化容器时将会扫描 base-package 指定的包目录及其子目录，为继承 Repository 或其子接口的接口创建代理对象，并将代理对象注册为 Spring Bean，业务层便可以通过...

2019-04-01

528

websocket 网易聊天室? web微信? 直播? 假如你工作以后,你的老板让你来开发一个内部的微信程序,你需要怎么办?我们先来分析一下里面的技术难点消息的实时性? 实现群聊现在有这样一个需求,老板给到你了,关乎你是否能转正?你要怎么做? 我们先说消息的实时性,按照我们目前的想法是我需要用http协议来做,那么http协议怎么来做那? 是不是要一直去访问我们的服务器,问服务器有没有人给我发消息,有没有人给我发消息?那么大家认为我多长时间去访问一次服务比较合适那? 1分钟1次?1分钟60次?那这样是不是有点问题那?咱们都知道http发起一次请求就需要三次握手,四次断开,那么这样是不是对我服务器资源是严重的浪费啊?对我本地的资源是不是也是严重的浪费啊?这种方式咱们是不是一直去服务器问啊?问有没有我的信息?有我就显示?这种方式咱们一般称为轮询 http协议: 一次请求一次相应断开无状态的 - 你曾经来过 session or cookie 在断开的情况下如果有数据只能等下次再访问的时候返回那么我们先来总结一下,轮询优缺点轮询 02年之前使用的都是这种...

2019-04-09

640

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。