Une fois que le système connaît un taux très élevé d'événements sur une courte période de temps, certains espaces du cluster TKG sur le superviseur ou du cluster Kubernetes en amont sont bloqués à l'état Arrêt.

Problème

Une fois que le système a récupéré d'un taux très élevé d'événements se produisant, l'interface utilisateur Système > NSX Application Platform affiche que NSX Application Platform est dans un état Dégradé. En outre, certains espaces du cluster TKG sur le superviseur ou le cluster Kubernetes en amont sont bloqués dans l'état Arrêt pendant au moins quelques minutes.

Cause

En raison de certains problèmes d'infrastructure Kubernetes, certains espaces ne peuvent pas être supprimés correctement pour l'une des raisons suivantes.
  • Un finaliseur associé à l'espace bloqué ne peut pas se terminer.
  • L'espace bloqué ne répond pas aux signaux d'arrêt.

Solution

Demandez à votre administrateur d'infrastructure d'utiliser les informations suivantes pour supprimer manuellement les espaces bloqués dans l'état Arrêt.
  1. Connectez-vous au nœud de contrôle de votre cluster TKG sur le superviseur ou le cluster Kubernetes en amont.
  2. Utilisez la commande suivante pour rechercher tous les espaces qui se trouvent dans l'état Arrêt.
    get pod -A | grep Terminating
  3. Forcez la suppression des espaces avec l'état Arrêt, à l'aide de la commande suivante.
    kubectl delete pod <pod-name> -n <namespace> --force --grace-period=0
  4. Répétez la commande suivante et vérifiez que les espaces bloqués ont été correctement supprimés. Si nécessaire, répétez l'étape 3 pour les espaces qui continuent à être à l'état Arrêt.
    get pod -A | grep Terminating