硬盘物理故障开盘+RAID-5阵列瘫痪恢复数据过程
服务器数据恢复故障描述
服 务 器 型 号:HP P2000
服务器操作系统:VMWARE ESX
服务器文件系统:VMFS
磁盘阵 列 级 别:RAID-5
需要进行数据恢复的服务器挂载了8块硬盘组成RAID-5磁盘阵列,其中4号盘是热备盘,服务器在正常运行中两块硬盘亮×××故障灯,经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别。需要对raid磁盘阵列进行数据恢复
**
硬盘物理故障修复
由于服务器故障情况严重,需要首先确定该组raid阵列的磁盘掉线原因,工程师在接到用户服务器后优先处理raid阵列中的两块掉线盘,将坏盘连接到外部的SAS扩展卡上加电检测,磁头不寻道,工程师将PCB分离、检查硬盘HDA组件发现有部分氧化,进行清洁操作后再次加电检查依然无法寻道。于是工程师进行十分复杂的修盘工作(无尘室禁止拍照修盘过程无图)
由于热备盘是正常硬盘,可以作为备件盘使用。于是硬件工程师将备件盘(也就是raid阵列中的4号盘)开盘拆取PCB安装到故障盘上替换故障盘的PCB进行修复,再将故障盘PCB上的ROM芯片拆取替换到新PCB上。硬盘硬件修复完成后再次对故障硬盘进行检测可以正常起转,磁头寻道声音正常,但是敲盘声音明显。由于4号盘的磁头与故障盘并不匹配,在另找配件后进行更换磁头操作,硬盘可以正常识别,故障盘数据镜像成功。
**
重组RAID-5磁盘阵列
使用数据恢复工具打开7块磁盘发现所有硬盘的的0扇区都有“55 AA”标志,0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。因此从0扇区看这是一个不正常的MBR分区结构。
按照这一方法继续查找,分别在7号盘和8号盘找到了“55 AA”的标志。8号盘查询结果如下。这是一个正常的MBR分区,其0x01C6处数值代表指向的下一个扇区为GPT的头部。
图1
7号盘查询结果如下。其0x01C6处数值代表指向下一个扇区。但是下一个扇区很明显不是GPT的头部。
图2
由此可以确定8号盘是第一块盘,7号盘可能是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
知识补课:条带也就是raid阵列块,它是RAID处理数据的基本单元。不同的RAID阵列的条带大小也各不相同。RAID-5的1个条带组中有1个校验区,根据这个规律可以对该raid-5阵列进行分析,也可以通过比较法确定条带大小。如某一条带组中的校验区跟这一条带组中的非校验区可能相差的很明显,通过WinHex查看并做对比,就可以找到条带大小。工程师对该服务器raid阵列分析得出条带大小为1024个扇区。
按照1024扇区分割,使一个记录为一个条带的大小,如图5所示。并且7块盘跳到同一记录283123。
图3
当7块盘都定位到同一位置时,通过对比可以判断校验区的走向,继而判断整个RAID-5的走向。之前已经判断出8号盘是第一块盘了,把8号盘放在第一个位置,确定RAID-5为左走向,盘序为8,2,3,4,1,7,5。
图4
工程师初步确定了LUN的起始扇区是172032扇区。使用数据恢复工具跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的5号盘应该是校验区,但实际情况中却显示校验区为8号盘,根据该raid左走向的规律,5号盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为5号盘。因此可以确定LUN的起始扇区为171008扇区。
使用数据恢复工具按照确定的盘序重组raid添加进去,如图所示。选择RAID-5,Stripe size 512KB,左异步。
图5
点击Build进行重组。组好后,由于数据从1024*8=8192个扇区开始,若专业恢复工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。RAID的起始扇区(Start sectors)选择8192,这个文件可以任意选择起始扇区和大小大小(Count sectors),下图为重组后的raid5磁盘阵列。
图6
**
服务器数据恢复结果
RAID-5磁盘阵列重建完成经由客户验证,验证通过,服务器数据恢复成功。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
MariaDB10.3 系统版本表 有效防止数据丢失
系统版本表是SQL:2011标准中首次引入的功能。系统版本表存储所有更改的历史数据,而不仅仅是当前时刻有效的数据。举个例子,同一行数据一秒内被更改了10次,那么就会保存10份不同时间的版本数据。就像《源代码》电影里的平行世界理论一样,你可以退回任意时间里。从而有效保障你的数据是安全的,DBA手抖或程序BUG引起的数据丢失,在MariaDB10.3里已成为过去。 一、创建系统版本表 例子: CREATE TABLE `t1` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(100) DEFAULT NULL, `ts` timestamp(6) GENERATED ALWAYS AS ROW START, `te` timestamp(6) GENERATED ALWAYS AS ROW END, PRIMARY KEY (`id`,`te`), PERIOD FOR SYSTEM_TIME (`ts`, `te`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 WITH SYSTEM VERSIO...
- 下一篇
被黑了,SSH服务需要大整顿
被黑经历:有一天下午,后台所有网址全部被跳转,第一反应就是服务器被黑了。首先到监测站点被篡改的脚本日志查看,检查主节点服务器上代码的完整性,发现index.php文件有被窜改的痕迹,所以导致跳转。xshell远程连接服务器,普通用户连不了,用root发现连不上密码显示错误,很明显,被黑后密码被篡改,xxx者想完全控制这台服务器,还好其它节点做了ssh连接免密机制,连进去没多久就被踢出终端连接了,普通用户的/etc/shadow和/etc/passwd都被删掉了,防火墙限制22端口的IP段被删掉了。 问题解决方法: 1.通过内网其它节点ssh远程连接主节点服务器,改掉默认端口22,改成xxxx。 2.改掉root用户密码,添加好普通用户, 3.加上防火墙限制IP的固定端口访问。重启防火墙 4.为了防止有异常程序或xxx在运行,重启服务器(主节点没跑什么服务,就nginx,读者自己斟酌) 为了防止下次再出现类似的问题,需要加强ssh服务防护和优化,下面是针对ssh服务的说明以及参数详解和配置实践。 基本大纲: 1.SSH服务协议说明 2.SSH配置文件相关参数详细说明 3.常用...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Linux系统CentOS6、CentOS7手动修改IP地址
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程