问题:
集群触发 HA 虚拟重定位卡住,尝试去其他主机启动虚拟机导致双开
原因:
在 A 主机 virsh create 时卡住,超过超时时间 170 秒后,程序将虚拟机进程给 kill 掉,但是虚拟机此时并未启动完成,没有生成 pid 号,系统并未查到需要 kill 的 pid,然后尝试去 B 主机启动虚拟机,正常启动,但 A 主机的虚拟机启动指令已经发送,后面又启动了 A 主机的虚拟机,导致双开
解决办法:
1、等待虚拟机启动完成
2、若长时间一直启动卡住,可以在主机上执行命令ps -ef|grep ‘virsh start找到卡住的进程id(注意virsh start进程关联的虚拟机名称跟卡住的虚拟机底层名称一致),执行命令 kill -9 进程 id 杀掉,再将虚拟机从其他节点启动