En esta sección se detalla cómo los usuarios pueden configurar, activar y desactivar los parámetros Comprobación de estado del nodo en clústeres de Tanzu Kubernetes Grid hasta el complemento de interfaz de usuario de Kubernetes Container Clusters 4.1.

La función Comprobación de estado del nodo consta de dos partes: detección y corrección.
Nota: Comprobación de estado del nodo y Reparación automática en caso de errores tienen diferentes funcionalidades. Comprobación de estado del nodo detecta y corrige nodos en estado incorrecto en el clúster solo después de que el clúster pasa a un estado Disponible, mientras que Reparación automática en caso de errores reintenta la creación del clúster si el clúster pasa al estado de error antes de que el estado del clúster pase a Disponible.
Nota: Comprobación de estado del nodo está desactivado de forma predeterminada en VMware Cloud Director Container Service Extension 4.1.

Detección de errores de nodo

VMware Cloud Director Container Service Extension 4.1 puede detectar cuándo un nodo de un clúster de Tanzu Kubernetes Grid pasa a tener un estado incorrecto. Cuando un nodo se encuentra en un estado incorrecto, el complemento de interfaz de usuario Kubernetes Container Clusters 4.1 refleja el recuento de nodos disponibles y deseados en la página de información del clúster. El fallo también se muestra en la sección Eventos de esa misma página.

Entre otros motivos, un nodo puede pasar a tener un estado incorrecto por lo siguiente:
  • Interrupciones de red
  • Interrupciones de alimentación
  • Baja velocidad del nodo debido a un uso elevado de memoria, CPU o disco
  • Error al iniciar el nodo
  • Error al unirse al clúster

Corrección de nodos

A partir de VMware Cloud Director Container Service Extension 4.1, la función Comprobación de estado del nodo detecta errores de nodos en los clústeres de Tanzu Kubernetes Grid y reemplaza automáticamente por nuevos nodos los nodos en estado incorrecto de Kubernetes. Los parámetros de Comprobación de estado del nodo forman parte de una configuración global obligatoria para configurar el servidor de VMware Cloud Director Container Service Extension y los flujos de trabajo de actualización del servidor, y los utiliza el complemento de interfaz de usuario de Kubernetes Container Clusters para crear clústeres o actualizar la configuración de los clústeres de todas las organizaciones. Para obtener más información, consulte Actualizar el servidor de VMware Cloud Director Container Service Extension. Los proveedores de servicios pueden regresar a la pestaña Actualizar servidor en cualquier momento para volver a configurar los parámetros de Comprobación de estado del nodo. Si los proveedores de servicios no configuran específicamente los parámetros de Comprobación de estado del nodo, se establecen los siguientes valores predeterminados:
Tabla 1. Configuración de Comprobación de estado del nodo
Parámetro de Comprobación de estado del nodo Valor predeterminado Descripción
Número máximo de nodos en estado incorrecto 100 %

La corrección se suspende cuando el porcentaje de nodos en estado incorrecto supera este valor. Cuando el valor predeterminado es 100 %; esto significa que el clúster siempre se corrige. Cuando el valor predeterminado es 0 %, esto significa que el clúster no se corrige.

Tiempo de espera de inicio del nodo 900 segundos

Si un nodo no se inicia en este período de tiempo, se considera que tiene un estado incorrecto y se corrige. Para un entorno de VMware Cloud Director determinado, se recomienda que los proveedores de servicios establezcan el parámetro Comprobación de estado del nodo al menos al doble del tiempo de creación y arranque de una máquina virtual.

Tiempo de espera agotado de estado de nodo "No preparado" 300 segundos Si un nodo recién unido no puede alojar cargas de trabajo durante más tiempo que este tiempo límite, se considera que tiene un estado incorrecto y se corrige.
Tiempo de espera agotado de estado de nodo "Desconocido" 300 segundos Si no se puede acceder a un nodo en estado correcto durante más tiempo que este tiempo límite, se considera que tiene un estado incorrecto y se corrige.
Al crear clústeres, los usuarios de tenant utilizan los parámetros de Comprobación de estado del nodo establecidos por el proveedor de servicios para su organización. Para obtener más información, consulte Crear un clúster de Tanzu Kubernetes Grid.
Nota: Cuando los proveedores de servicios actualizan los parámetros de Comprobación de estado del nodo no se modifican los parámetros existentes de Comprobación de estado del nodo en los clústeres de Tanzu Kubernetes Grid que ya están implementados.

Activar o desactivar Comprobación de estado del nodo en un clúster de VMware Cloud Director Container Service Extension 4.0.x

Los usuarios de tenant también pueden activar o desactivar Comprobación de estado del nodo en los clústeres que se crearon en VMware Cloud Director Container Service Extension 4.0.x.

Los siguientes pasos describen cómo los usuarios de tenant pueden realizar esta acción:

  1. Inicie sesión en el portal de VMware Cloud Director y, en la barra de navegación superior, seleccione Más > Clústeres de contenedor de Kubernetes.
  2. Haga clic en el nombre del clúster y, en la página de información del clúster, haga clic en Configuración.
  3. Active o desactive Comprobación de estado del nodo y haga clic en Guardar.