El algoritmo de Elastic DRS supervisa el uso de recursos en un clúster a través del tiempo. Después de tener en cuenta los saltos y la aleatoriedad del uso, hace una recomendación para escalar o reducir horizontalmente en un clúster y genera una alerta. Esta alerta se procesa inmediatamente mediante el aprovisionamiento de un host nuevo o la eliminación un host en el clúster.

El algoritmo se ejecuta cada 5 minutos y utiliza los siguientes parámetros:
  • El número mínimo y máximo de hosts que el algoritmo debe escalar de manera vertical u horizontal.
  • Los umbrales de uso de CPU, memoria y almacenamiento, de manera que la asignación de hosts esté optimizada en relación con el coste y el rendimiento. Estos umbrales, que se enumeran en la página Administrar elasticidad en clústeres de SDDC, están predefinidos para cada tipo de directiva de DRS y el usuario no puede alterarlos.

Recomendación de escalado horizontal

Se genera una recomendación de escalado horizontal cuando el uso de CPU, memoria o almacenamiento permanece constantemente por encima de los umbrales. Por ejemplo, si el uso de almacenamiento sobrepasa el umbral alto, pero el uso de memoria y CPU permanece por debajo de sus respectivos umbrales, se genera una recomendación de escalado horizontal. Se publica un evento de vCenter Server para indicar el inicio, la finalización o el error de la operación de escalado horizontal en el clúster.

Recomendación de escalado vertical

Se genera una recomendación de escalado vertical cuando el uso de CPU, memoria y almacenamiento se mantienen todos constantemente por debajo de los umbrales. La recomendación de escalado vertical no se aplica si el número de hosts del clúster es el valor mínimo especificado. Se publica un evento de vCenter Server para indicar el inicio, la finalización o el error de la operación de escalado vertical en el clúster.

Nota:

Cuando se reduce el tamaño del clúster, aumenta la latencia de almacenamiento debido a la sobrecarga de procesos que causa la eliminación del host. La duración de esta sobrecarga varía en función de la cantidad de datos involucrados. Es posible que solo dure una hora, pero, en casos extremos, podría necesitar más de 48 horas. Mientras se realiza la reducción del tamaño de clúster (reducción horizontal), las máquinas virtuales de carga de trabajo compatibles con los clústeres afectados pueden experimentar un aumento significativo de la latencia de almacenamiento.

Escalado de clústeres ampliados

Cuando Elastic DRS genera un evento de escalado vertical u horizontal para un clúster ampliado (con varias zonas de disponibilidad), los hosts se eliminan o se agregan en ambas zonas de disponibilidad.

Si se produce un error en un host en un clúster ampliado, Elastic DRS intenta reemplazarlo en su zona de disponibilidad original. Si no puede hacerlo debido a un error de zona de disponibilidad completo o parcial, Elastic DRS escala horizontalmente el clúster en la zona de disponibilidad restante. Agrega hosts no facturables en la zona de disponibilidad restante hasta que el clúster alcanza su recuento original de hosts. Este flujo de trabajo de escalado horizontal depende de la capacidad disponible y no está garantizado. Cuando se restaura la zona de disponibilidad con errores, Elastic DRS reduce la escala el clúster para eliminar los hosts adicionales, restaurando el recuento de hosts original.

Hay más información sobre cómo Elastic DRS controla los escenarios de errores de escalado y zona en el artículo de VMware Cloud Tech Zone VMware Cloud on AWS: clústeres ampliados.

Retrasos entre dos recomendaciones

El algoritmo incluye una comprobación de seguridad para evitar el procesamiento de eventos que se generan con frecuencia y para permitir que el clúster se recupere de los cambios causados por el último evento procesado. Se aplican los siguientes intervalos de tiempo entre eventos:

  • Un retraso de 30 minutos entre dos eventos de escalado horizontal sucesivos.
  • Un retraso de tres horas para procesar un evento de reducción horizontal después de realizar una operación de escalado horizontal en el clúster.

Interacciones de las recomendaciones con otras operaciones

Es posible que las siguientes operaciones interactúen con las recomendaciones de Elastic DRS:

  • Adición o eliminación de hosts iniciadas por el usuario.

    Normalmente, no es necesario agregar hosts de forma manual a un clúster o quitarlos de este si Elastic DRS está habilitado. Aun así, es posible realizar estas operaciones, aunque puede que una recomendación de Elastic DRS las revierta en algún momento.

    Si hay una operación de adición o eliminación de hosts iniciada por el usuario en curso, se ignorará la recomendación actual del algoritmo de Elastic DRS. Una vez finalizada la operación iniciada por el usuario, el algoritmo puede recomendar una operación de escalado vertical u horizontal en función de los cambios en el uso de recursos y la directiva seleccionada en ese momento.

    Si inicia una operación para agregar o eliminar hosts mientras se está aplicando una recomendación de Elastic DRS, se producirá un error en la operación de agregado o eliminación del host, lo que indica una excepción de actualización simultánea.

  • Operación de mantenimiento planificado

    Una operación de mantenimiento planificado implica que se debe sustituir un host concreto por uno nuevo. Mientras haya una operación de mantenimiento planificado en curso, se ignorarán las recomendaciones actuales del algoritmo de Elastic DRS. Una vez que se complete el mantenimiento planificado, el algoritmo se volverá a ejecutar y se aplicarán recomendaciones nuevas. Si se inicia un evento de mantenimiento planificado en un clúster mientras se aplica una recomendación de Elastic DRS a dicho clúster, la tarea de mantenimiento planificado se pondrá en cola. Una vez finalizada la tarea de recomendación de Elastic DRS, se iniciará la tarea de mantenimiento planificado.

  • Corrección automática

    Durante la corrección automática, un host con errores se reemplaza por un host nuevo y sus etiquetas de host se aplican al host de reemplazo. Mientras la corrección automática está en curso, se ignoran las recomendaciones actuales del algoritmo de Elastic DRS. Después de que se complete la corrección automática, el algoritmo se vuelve a ejecutar y se aplican recomendaciones nuevas. Si se inicia un evento de corrección automática para un clúster mientras se aplica una recomendación de Elastic DRS a dicho clúster, la tarea de corrección automática se pondrá en cola. Una vez finalizada la tarea de recomendación de Elastic DRS, se iniciará la tarea de corrección automática.

  • Ventana de mantenimiento de SDDC

    Si hay una operación de mantenimiento en curso en un SDDC o si esta está programada para las próximas seis horas, se ignorarán las recomendaciones de EDRS.