La restauration d'un nœud Automation Orchestrator peut entraîner des problèmes avec le service Kubernetes.
Pour récupérer un nœud problématique dans le cluster Automation Orchestrator, vous devez localiser le nœud, le supprimer du cluster, puis le rajouter au cluster.
Procédure
- Identifiez le nœud principal du cluster Automation Orchestrator.
- Connectez-vous à la ligne de commande Automation Orchestrator Appliance de l'un des nœuds sur SSH en tant qu'utilisateur racine.
- Recherchez le nœud disposant du rôle
primary
en exécutant la commande kubectl -n prelude exec postgres-0.
kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
- Récupérez le nom de l'espace dans lequel se trouve le nœud principal.
Dans la plupart des cas, le nom de l'espace est
postgres-0.postgres.prelude.svc.cluster.local
.
- Recherchez l'adresse du nom de domaine complet du nœud principal en exécutant la commande kubectl -n prelude get pods.
kubectl -n prelude get pods -o wide
- Recherchez l'espace de base de données portant le nom que vous avez récupéré et obtenez l'adresse du nom de domaine complet du nœud correspondant.
- Localisez le nœud problématique en exécutant la commande kubectl -n prelude get node.
L'état du nœud problématique est
NotReady
.
- Connectez-vous à la ligne de commande Automation Orchestrator Appliance du nœud principal sur SSH en tant qu'utilisateur racine.
- Supprimez le nœud problématique du cluster en exécutant la commande vracli cluster remove <NODE-FQDN>.
- Connectez-vous à la ligne de commande Automation Orchestrator Appliance du nœud problématique sur SSH en tant qu'utilisateur racine.
- Rajoutez le nœud au cluster en exécutant la commande vracli cluster join <MASTER-DB-NODE-FQDN>.