Cette section explique comment les utilisateurs peuvent configurer, activer et désactiver les paramètres Vérification de l'intégrité du nœud dans les clusters Tanzu Kubernetes Grid Kubernetes Container Clusters 4.1.

La fonctionnalité Vérification de l'intégrité du nœud comprend deux parties : Détection et correction.
Note : Les fonctionnalités Vérification de l'intégrité du nœud et Réparation automatique des erreurs sont différentes. Vérification de l'intégrité du nœud détecte et corrige les nœuds défectueux dans le cluster uniquement après que le cluster passe à l'état Disponible, tandis que Réparation automatique des erreurs tente de nouveau de créer le cluster si le cluster passe à l'état d'erreur avant son état ne devienne Disponible.
Note : Vérification de l'intégrité du nœud est désactivée par défaut dans VMware Cloud Director Container Service Extension 4.1.

Détection de panne de nœud

VMware Cloud Director Container Service Extension 4.1 peut détecter qu'un nœud d'un cluster Tanzu Kubernetes Grid devient défectueux. Lorsqu'un nœud est dans un état défectueux, le plug-in de l'interface utilisateur de Kubernetes Container Clusters 4.1 reflète le nombre de nœuds disponibles et le nombre de nœuds souhaités dans la page d'informations du cluster, et la panne s'affiche également dans la section Événements de cette même page.

Un nœud peut devenir défectueux pour les raisons suivantes, mais sans s'y limiter :
  • Pannes réseau
  • Interruptions d'alimentation
  • Vitesse de nœud faible en raison d'une utilisation élevée de la mémoire, du CPU ou du disque
  • Échec de démarrage du nœud
  • Échec de la jonction au cluster

Correction des nœuds

À partir de VMware Cloud Director Container Service Extension 4.1, la fonctionnalité Vérification de l'intégrité du nœud Tanzu Kubernetes Grid détecte les pannes de nœuds dans les clusters et remplace automatiquement les nœuds Kubernetes défectueux par de nouveaux nœuds. Les paramètres de vérification de l'intégrité du nœud ont des paramètres globaux requis pour la configuration du serveur VMware Cloud Director Container Service Extension et les workflows de mise à jour du serveur, qui sont utilisés par le plug-in d'interface utilisateur de Kubernetes Container Clusters pour créer des clusters ou mettre à jour les paramètres des clusters dans toutes les organisations. Pour plus d'informations, reportez-vous à la section Mettre à jour le serveur VMware Cloud Director Container Service Extension. Les fournisseurs de services peuvent revenir à l'onglet Mettre à jour le serveur à tout moment pour reconfigurer les paramètres de Vérification de l'intégrité du nœud. Si les fournisseurs de services ne configurent pas spécifiquement les paramètres de Vérification de l'intégrité du nœud, les valeurs par défaut suivantes sont définies :
Tableau 1. Configuration de la vérification de l'intégrité du nœud
Paramètre de vérification de santé du nœud Valeur par défaut Description
Nombre maximal de nœuds défectueux 100 %

La correction est interrompue lorsque le pourcentage de nœuds défectueux dépasse cette valeur. Lorsque la valeur par défaut est de 100 %, cela signifie que le cluster est toujours corrigé. Lorsque la valeur par défaut est de 0 %, cela signifie que le cluster n'effectue aucune correction.

Délai d'expiration du démarrage du nœud 900 secondes

Si un nœud ne démarre pas dans cette période, il est considéré comme défectueux et il est corrigé. Pour un environnement VMware Cloud Director donné, il est recommandé aux fournisseurs de services de définir le paramètre Vérification de l'intégrité du nœud sur une valeur au moins deux fois plus longue que le temps de création et de démarrage d'une machine virtuelle.

Délai d'état de l'état du nœud « Non prêt » 300 secondes. Si un nœud récemment joint ne peut pas héberger des charges de travail plus longtemps que ce délai d'exécution, il est considéré comme défectueux et il est corrigé.
Délai d'état de l'état du nœud « Inconnu » 300 secondes. Si un nœud sain est inaccessible plus longtemps que ce délai d'expiration, il est considéré comme défectueux et il est corrigé.
Les utilisateurs locataires utilisent les paramètres Vérification de l'intégrité du nœud définis par le fournisseur de services pour leur organisation lorsqu'ils créent des clusters. Pour plus d'informations, reportez-vous à la section Créer un cluster Tanzu Kubernetes Grid.
Note : Lorsque les fournisseurs de services mettent à jour les paramètres Vérification de l'intégrité du nœud, les paramètres Vérification de l'intégrité du nœud existants sur les clusters Tanzu Kubernetes Grid qui sont déjà déployés ne sont pas modifiés.

Activer ou désactiver la vérification de l'intégrité du nœud dans un cluster VMware Cloud Director Container Service Extension 4.0.x

Les utilisateurs locataires peuvent également activer ou désactiver Vérification de l'intégrité du nœud sur les clusters qui ont été créés dans VMware Cloud Director Container Service Extension 4.0.x.

Les étapes suivantes décrivent comment les utilisateurs de locataire peuvent effectuer cette action :

  1. Connectez-vous au portail VMware Cloud Director et, dans la barre de navigation, sélectionnez Plus > Kubernetes Container Clusters.
  2. Cliquez sur le nom du cluster et, dans la page d'informations sur le cluster, cliquez sur Paramètres.
  3. Activez ou désactivez l'onglet Vérification de l'intégrité du nœud, puis cliquez sur Enregistrer.