通过ssh远程连接到WinCenter,执行以下命令查看服务是否正常运行,
ck
所有服务均为running,则证明服务为正常状态。
若是搭建了平台高可用。则执行以下命令可以查看平台服务的高可用状态:
ck ha <对端WinCenter ip>
由图可知,所有微服务都为running状态,redis为master&slave状态,rabbitmq集群名字统一,包括运行节点为两个WinCenter节点,mysql数据库状态为4个yes,则代表平台高可用服务正常。
平台上的告警信息,可以准确体现出超融合平台存在的风险问题,可以通过WinCenter的告警信息,及时发现平台的问题,进行修复。
登录WinCenter地址,点击集群-告警信息查看
平台断电之后,无法正常登录,底层查看ck ha <ip>后,发现数据库报错,如何解决?
答:ck ha <ip>检查数据库的报错信息,若是报错1007,1008,1050,1051,1054,1060,1061,1068,1094,1062,1053,1146,1526,1507,1517,
1、修改/etc/my.cnf,再[mysqld]下添加slave-skip-errors=1007,1008,1050,1051,1054,1060,1061,1068,1094,1062,1053,1146,1526,1507,1517
2、重启数据库服务
3、重新做数据库主备
管理平台在运行一段时间后,数据量过大,mysql目录已爆满,如何处理?
答:
1、扩容管理平台虚拟磁盘,virsh blockresize <vm-name> <disk-path> 500G
2、扩容xfs目录 xfs_growfs /dev/<数据库目录磁盘>
3、重启数据库
如果在poc测试过程中误开启三员管理,如何关闭?
答:可使用postman工具通过接口关闭三员管理
平台上显示虚拟机为红色感叹号状态,如何排查处理?
答:
1、检查虚拟机所在物理节点网络是否正常
2、检查虚拟机所使用存储是否正常
3、检查wincenter虚拟机是否正常,或者重启wincenter虚拟机
4、检查计算节点的libvirt服务是否正常
在winstack8.2.2前的版本,直接关闭HA会导致虚拟机关机,如何规避?
答:先将虚拟机设置为不启用HA,再去关闭HA
管理平台无法开启集群HA,报错存在网络隔离,如何排查?
答:
1、通过omping工具,测试组播15分钟-30分钟,测试集群内的组播是否正常
2、若组播不正常,15分钟后会断连,证明交换机开启了组播抑制,需要关闭
3、检查hosts文件,是否与目前的主机名一致
成功创建Ipsan存储池之后,同步主机会造成存储池丢失,但是底层存在,同步日志报错存储池格式不对?
答:检查存储池的xml文件,会发现LUNname中的iqn号,不存在“iqn”三个字符,因此上层判断该存储池为非正常存储池,某些后端存储可以自定义iqn号,可让存储服务端修改iqn号即可。