故障情况
近日,我司接到一台由两块物理硬盘组成RAID1的机架式服务器,因为两块硬盘均存在物理损坏,从而导致服务器整个存储空间不可用。
分析故障原因
工程师在了解到情况后,先通过使用专业设备对两块硬盘进行物理上的检测和分析,检测中发现,两块硬盘#1号碟面都有不同程度的损伤情况。
据用户描述,一开始能在PE系统下识别到硬盘,用户通过PE系统引导有尝试过拷贝他比较重要的数据库文件,所以导致两块硬盘的#1号磁头碰到坏道区域造成磁头损坏和碟片损伤。
由于RAID1的特性,两块硬盘数据基本上是一样的,但可能会存在离线时间先后顺序问题。
制定方案
1、根据情况,我司工程师制定可行方案,决定先通过专业设备将两块硬盘除损坏磁头外可读的磁头先做镜像备份。
2、分别对两块硬盘做更换磁头读取硬盘#1面,由于#1面存在划伤情况,有部分扇区未能读取。
3、记录两块硬盘的损坏区域情况,再利用RAID1的特性对两个硬盘未能镜像的区域进行一致性对比、互补拼接。
经过多个小时的努力,客户要求恢复的数据库文件最终可以顺利加载到数据库引擎,最后经过用户对数据的验证,数据记录完整,本次恢复工作结束。