WinCenter运维管理及常见问题

小宏 4月前 203

通过ssh远程连接到WinCenter,执行以下命令查看服务是否正常运行,

ck


所有服务均为running,则证明服务为正常状态。

若是搭建了平台高可用。则执行以下命令可以查看平台服务的高可用状态:

ck ha <对端WinCenter ip>

由图可知,所有微服务都为running状态,redis为master&slave状态,rabbitmq集群名字统一,包括运行节点为两个WinCenter节点,mysql数据库状态为4个yes,则代表平台高可用服务正常。


平台上的告警信息,可以准确体现出超融合平台存在的风险问题,可以通过WinCenter的告警信息,及时发现平台的问题,进行修复。

登录WinCenter地址,点击集群-告警信息查看


平台断电之后,无法正常登录,底层查看ck ha <ip>后,发现数据库报错,如何解决?

答:ck ha <ip>检查数据库的报错信息,若是报错1007,1008,1050,1051,1054,1060,1061,1068,1094,1062,1053,1146,1526,1507,1517,

1、修改/etc/my.cnf,再[mysqld]下添加slave-skip-errors=1007,1008,1050,1051,1054,1060,1061,1068,1094,1062,1053,1146,1526,1507,1517

2、重启数据库服务

3、重新做数据库主备


管理平台在运行一段时间后,数据量过大,mysql目录已爆满,如何处理?

答:

1、扩容管理平台虚拟磁盘,virsh blockresize <vm-name> <disk-path> 500G

2、扩容xfs目录 xfs_growfs /dev/<数据库目录磁盘>

3、重启数据库


如果在poc测试过程中误开启三员管理,如何关闭?

答:可使用postman工具通过接口关闭三员管理


平台上显示虚拟机为红色感叹号状态,如何排查处理?

答:

1、检查虚拟机所在物理节点网络是否正常

2、检查虚拟机所使用存储是否正常

3、检查wincenter虚拟机是否正常,或者重启wincenter虚拟机

4、检查计算节点的libvirt服务是否正常


在winstack8.2.2前的版本,直接关闭HA会导致虚拟机关机,如何规避?

答:先将虚拟机设置为不启用HA,再去关闭HA


管理平台无法开启集群HA,报错存在网络隔离,如何排查?

答:

1、通过omping工具,测试组播15分钟-30分钟,测试集群内的组播是否正常

2、若组播不正常,15分钟后会断连,证明交换机开启了组播抑制,需要关闭

3、检查hosts文件,是否与目前的主机名一致


成功创建Ipsan存储池之后,同步主机会造成存储池丢失,但是底层存在,同步日志报错存储池格式不对?

答:检查存储池的xml文件,会发现LUNname中的iqn号,不存在“iqn”三个字符,因此上层判断该存储池为非正常存储池,某些后端存储可以自定义iqn号,可让存储服务端修改iqn号即可。


 

最新回复 (0)
全部楼主
返回
发新帖