Puede configurar vSphere HA para que tolere una cantidad específica de errores del host. Con la directiva de control de admisión Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host), vSphere HA asegura que pueda fallar una cantidad específica de hosts y que permanezcan suficientes recursos en el clúster para realizar conmutación por error en todas las máquinas virtuales desde dichos hosts.

Con la directiva Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host), vSphere HA realiza el control de admisión de la siguiente forma:

  1. Calcula el tamaño de ranura.

    Una ranura es una representación lógica de los recursos de memoria y CPU. De forma predeterminada, tiene un tamaño para que satisfaga los requisitos para cualquier máquina virtual encendida en el clúster.

  2. Determina cuántas ranuras puede mantener cada host en el clúster.

  3. Determina la capacidad actual de conmutación por error del clúster.

    Esta es la cantidad de hosts que pueden tener errores y aún así dejar suficientes ranuras para que atienda a todas las máquinas virtuales encendidas.

  4. Determina si la capacidad actual de conmutación por error es inferior a la capacidad configurada de conmutación por error (provista por el usuario).

    Si lo es, el control de admisión no permite la operación.

Nota:

Puede configurar un tamaño de ranura específico tanto para la CPU como la memoria en la sección de control de admisión de la configuración de vSphere HA en vSphere Web Client.

Calcular el tamaño de ranura

El tamaño de ranura consta de dos componentes: la CPU y la memoria.

  • vSphere HA calcula el componente de CPU obteniendo la reserva de CPU de cada máquina virtual encendida y seleccionando el mayor valor. Si no ha especificado una reserva de CPU para una máquina virtual, se asigna un valor predeterminado de 32 MHz. Puede cambiar este valor usando la opción avanzada das.vmcpuminmhz.

  • vSphere HA calcula el componente de memoria obteniendo la reserva de memoria, además de la sobrecarga de memoria, de cada máquina virtual encendida y seleccionando el mayor valor. No hay un valor predeterminado para la reserva de memoria.

Si su clúster contiene máquinas virtuales que tienen reservas mucho mayores que las otras, distorsionarán el cálculo del tamaño de ranura. Para evitar esto, puede especificar un límite superior para el componente de CPU o memoria del tamaño de ranura mediante el uso de las opciones avanzadas das.slotcpuinmhz odas.slotmeminmb, respectivamente. Consulte Opciones avanzadas de vSphere HA.

También puede determinar el riesgo de fragmentación de recursos en su clúster viendo la cantidad de máquinas virtuales que requieren varias ranuras. Esto se puede calcular en la sección de control de admisión de la configuración de vSphere HA en vSphere Web Client. Las máquinas virtuales pueden necesitar varias ranuras en caso de que haya especificado un tamaño de ranura fijo o un tamaño de ranura máximo usando opciones avanzadas.

Usar ranuras para calcular la capacidad actual de conmutación por error

Después de calcular el tamaño de ranura, vSphere HA determina los recursos de CPU y memoria de cada host que están disponibles para máquinas virtuales. Estas cantidades son aquellas que están contenidas en el grupo de recursos raíz del host, no los recursos físicos totales del host. Los datos de recursos para un host que utiliza vSphere HA se pueden encontrar en la pestaña Summary (Resumen) del host en vSphere Web Client. Si todos los hosts de su clúster son iguales, estos datos se pueden obtener dividiendo las cifras de nivel de clúster por la cantidad de hosts. Los recursos que se van a usar para fines de virtualización no están incluidos. Solo se consideran los hosts que están conectados, que no están en modo de mantenimiento y que no tienen errores de vSphere HA.

Luego, se determina la cantidad máxima de ranuras que puede admitir cada host. Para hacerlo, la cantidad de recursos de CPU del host se divide por el componente de CPU del tamaño de ranura y el resultado se redondea hacia abajo. El mismo cálculo se hace para la cantidad de recursos de memoria del host. Estos números se comparan y el número menor es la cantidad de ranuras que puede admitir el host.

La capacidad actual de conmutación por error se calcula determinando cuántos hosts (comenzando desde el más grande) pueden generar errores y aún dejar suficientes ranuras para atender los requisitos de todas las máquinas virtuales encendidas.

Información de tiempo de ejecución avanzada

Cuando selecciona la directiva de control de admisión Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host), aparece el panel Advanced Runtime Info (Información de tiempo de ejecución avanzada) en la sección de vSphere HA de la pestaña Monitor (Supervisar) del clúster en vSphere Web Client. Este panel muestra la siguiente información acerca del clúster:

  • Slot size (Tamaño de ranura).

  • Cantidad total de ranuras en el clúster. La suma de las ranuras que admiten hosts buenos en el clúster.

  • Used slots (Ranuras utilizadas). La cantidad de ranuras asignadas a máquinas virtuales encendidas. Puede ser mayor que la cantidad de máquinas virtuales encendidas si ha definido un límite superior para el tamaño de ranura mediante las opciones avanzadas. Esto se debe a que algunas máquinas virtuales pueden consumir varias ranuras.

  • Available slots (Ranuras disponibles). La cantidad de ranuras disponibles para encender máquinas virtuales en el clúster. vSphere HA reserva la cantidad necesaria de ranuras para conmutación por error. Las ranuras restantes están disponibles para encender máquinas virtuales.

  • Failover slots (Slots para conmutación por error). La cantidad total de ranuras sin contar las ranuras usadas o las ranuras disponibles.

  • Cantidad total de máquinas virtuales encendidas en el clúster.

  • Total number of hosts in cluster (Cantidad total de hosts en el clúster).

  • Hosts buenos totales en el clúster. La cantidad de hosts que están conectados, no en modo de mantenimiento, y que no tienen errores de vSphere HA.

Control de admisión mediante la directiva Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host)

La forma en que se calcula y se usa el tamaño de ranura con esta directiva de control de admisión se muestra en un ejemplo. Haga las siguientes suposiciones sobre un clúster:

  • El clúster está compuesto de tres hosts, cada uno con una cantidad diferente de recursos de CPU y de memoria disponibles. El primer host (H1) posee 9 GHz de recursos de CPU disponibles y 9 GB de memoria disponible, en tanto que el host 2 (H2) tiene 9 GHz y 6 GB y el host 3 (H3) cuenta con 6 GHz y 6 GB.

  • Existen cinco máquinas virtuales encendidas en el clúster con diferentes requisitos de CPU y memoria. La máquina virtual 1 necesita 2 GHz de recursos de CPU y 1 GB de memoria, en tanto que la máquina virtual 2 requiere 2 GHz y 1 GB, la máquina virtual 3, 1 GHz y 2 GB, la máquina virtual 4 necesita 1 GHz y 1 GB y la máquina virtual 5, 1 GHz y 1 GB.

  • Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host) está configurada en uno.

Figura 1. Ejemplo de control de admisión con directiva Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host)
Este es un ejemplo de control de admisión con la directiva Host Failures Cluster Tolerates (Tolerancias del clúster para errores del host).
  1. El tamaño de ranura se calcula comparando tanto los requisitos de CPU como de memoria de las máquinas virtuales y seleccionando el de mayor tamaño.

    El mayor requisito de CPU (compartido por la máquina virtual 1 y la máquina virtual 2) es 2 GHz, en tanto que el mayor requisito de memoria (para la máquina virtual 3) es 2 GB. Basado en esto, el tamaño de ranura es CPU de 2 GHz y memoria de 2 GB.

  2. Se determina la cantidad máxima de ranuras que puede admitir cada host.

    H1 puede admitir cuatro ranuras. H2 puede admitir tres ranuras (que es la cantidad menor de 9 GHz/2 GHz y 6 GB/2 GB) y H3 también puede admitir tres ranuras.

  3. Se calcula la capacidad actual de conmutación por error.

    El host más grande es el H1 y si genera errores, seis ranuras permanecen en el clúster, lo que es suficiente para las cinco máquinas virtuales encendidas. Si hay error tanto de H1 como de H2, solo quedan tres ranuras, lo que no es suficiente. Por lo tanto, la capacidad actual de conmutación por error es uno.

El clúster tiene una ranura disponible (las seis ranuras en H2 y H3 menos las cinco ranuras usadas).