即使主虚拟机或辅助虚拟机的 ESXi 主机未崩溃,主虚拟机或辅助虚拟机也可进行故障切换。在这种情况下,虚拟机执行不会中断,但会临时失去冗余。要避免此类故障切换,请了解可能会出现此类故障切换的一些情况,并采取措施进行避免。
与存储器有关的部分硬件故障
当存储器访问缓慢或无法访问某台主机时,可能出现此问题。此问题发生时,VMkernel 日志中将列出许多存储器错误。要解决此问题,必须解决与存储器有关的问题。
与网络有关的部分硬件故障
如果日志记录网卡不能正常工作或通过该网卡与其他主机的连接断开,将触发容错虚拟机进行故障切换,从而重新建立冗余。要避免此问题,请将每个独立网卡专门用于 vMotion 和容错日志记录通信,并仅在虚拟机活动较少时执行 vMotion 迁移。
日志记录网卡网络上的带宽不足
如果主机上有过多的容错虚拟机,则会发生此问题。要解决此问题,请将容错虚拟机对分布到更多的不同主机上。
请对 FT 使用 10 Gb 日志记录网络并验证网络滞后时间是否非常短。
由虚拟机活动级别引起的 vMotion 故障
如果通过 vMotion 迁移容错虚拟机失败,则虚拟机可能需要进行故障切换。此问题通常在虚拟机过于活跃(因而无法在对其造成最小损坏的情况下完成迁移)时发生。要避免此问题,请只在虚拟机活动较少时执行 vMotion 迁移。
VMFS 卷上活动过多可能会导致虚拟机故障切换
在单一 VMFS 卷上执行大量文件系统锁定操作、虚拟机启动/关闭或 vMotion 迁移时,可能会触发容错虚拟机进行故障切换。可能发生此现象的症状为在 VMkernel 日志中收到许多有关 SCSI 预留的警告。要解决此问题,请减少文件系统操作的数量,或确保容错虚拟机位于 VMFS 卷上,而且该卷上没有大量定期启动/关闭或使用 vMotion 进行迁移的其他虚拟机。
文件系统空间不足导致无法启动辅助虚拟机
请检查 /(root) 或 /vmfs/datasource 文件系统中是否有可用空间。这些文件系统可能会因多种原因而变得空间已满,空间不足会导致您无法启动新辅助虚拟机。