Una máquina virtual principal o secundaria puede realizar conmutación por error aunque su host ESXi no haya generado errores. En dichos casos, la ejecución de la máquina virtual no se interrumpe, pero la redundancia se pierde temporalmente. Para evitar este tipo de conmutación por error, esté consciente de algunas de las situaciones en las que se pueden producir y tome las medidas para evitarlas.
Error parcial de hardware relacionado con almacenamiento
Este problema puede surgir cuando el acceso al almacenamiento sea lento o está caído para uno de los hosts. Cuando ocurre esto, hay muchos errores de almacenamiento que se indican en el registro de VMkernel. Para resolver este problema, debe solucionar aquellos relacionados con el almacenamiento.
Error parcial de hardware relacionado con la red
Si la NIC de registro no está funcionando o las conexiones a otros hosts a través de esa NIC están caídas, esto puede activar la conmutación por error de una máquina virtual con Fault Tolerance, de manera que puede restablecerse la redundancia. Con el fin de evitar este problema, dedique una NIC separada para cada vMotion y tráfico de registro de FT, y realice migraciones de vMotion solo cuando las máquinas virtuales estén menos activas.
Ancho de banda insuficiente en la red de NIC de registro
Esto puede ocurrir debido a que hay demasiadas máquinas virtuales con Fault Tolerance en un host. Para solucionar este problema, distribuya de forma más amplia pares de máquinas virtuales con Fault Tolerance entre diferentes hosts.
Use una red de registro de 10 Gbit para FT y verifique que la red tenga baja latencia.
Errores de vMotion debido al nivel de actividad de la máquina virtual
Si hay error en la migración por parte de vMotion de una máquina virtual con Fault Tolerance, es posible que la máquina virtual pueda necesitar conmutación por error. Generalmente, esto ocurre cuando la máquina virtual está demasiado activa para que se realice la migración solo con una interrupción mínima de la actividad. Para evitar este problema, realice migraciones de vMotion únicamente cuando las máquinas virtuales están menos activas.
Demasiada actividad en volumen VMFS pueden conducir a conmutaciones por error de la máquina virtual
Cuando se producen varias operaciones de bloqueo del sistema de archivos, encendidos de máquinas virtuales, apagados de máquinas virtuales o migraciones de vMotion en un solo volumen VMFS, esto puede activar la conmutación por error de máquinas virtuales con Fault Tolerance. Un síntoma de que esto podría estar pasando es recibir muchas advertencias sobre reservas de SCSI en el registro de VMkernel. Para solucionar este problema, reduzca la cantidad de operaciones del sistema de archivos o asegúrese de que la máquina virtual con Fault Tolerance esté en un volumen VMFS que no tenga demasiadas otras máquinas virtuales que regularmente se estén encendiendo, apagando o migrando mediante el uso de vMotion.
Falta de espacio del sistema de archivos evita el inicio de la máquina virtual secundaria
Compruebe si sus sistemas de archivos /(root) o /vmfs/datasource tienen o no espacio disponible. Estos sistemas de archivos pueden llenarse por varias razones, y si falta espacio no podrá iniciar una nueva máquina virtual secundaria.