问题:
1、开启集群 HA,FC SAN 的共享文件系统存储池作为 SBD 仲裁存储,拔一台主机的 FC 光纤线,模拟存储故障,存储池被 umont 且主机不会被重启,将光纤线插回去后,启动存储池,存储池仍无法恢复,在主机上看到如下报错
在主机上用 dmseg 看到如下信息,说明数据不一致,表明共享文件系统被损坏了需要 fsck
解决办法:
修复共享文件系统,修复流程:
- 关闭所有使用该 ocfs2 的存储池
- 查询出 lun 的设备路径 xxxxxx:multipath -ll, lsblk
- 执行修复命令:fsck.ocfs2 -F -f -y -P /dev/mapper/xxxxxx