Il ripristino di un nodo di Automation Orchestrator può causare problemi con il servizio Kubernetes.
Per ripristinare un nodo problematico nel cluster di Automation Orchestrator, è necessario individuare il nodo, rimuoverlo dal cluster e quindi aggiungerlo di nuovo al cluster.
Procedura
- Identificare il nodo primario del cluster di Automation Orchestrator.
- Accedere alla riga di comando di Automation Orchestrator Appliance di uno dei nodi tramite SSH come root.
- Individuare il nodo con il ruolo
primary
eseguendo il comando kubectl -n prelude exec postgres-0.
kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
- Recuperare il nome del pod in cui si trova il nodo primario.
Nella maggior parte dei casi, il nome del pod è
postgres-0.postgres.prelude.svc.cluster.local
.
- Individuare l'indirizzo del nome di dominio completo del nodo primario eseguendo il comando kubectl -n prelude get pods.
kubectl -n prelude get pods -o wide
- Individuare il pod del database con il nome recuperato e ottenere l'indirizzo del nome di dominio completo per il nodo corrispondente.
- Individuare il nodo problematico eseguendo il comando kubectl -n prelude get node.
Il nodo problematico ha stato
NotReady
.
- Accedere alla riga di comando di Automation Orchestrator Appliance del nodo primario tramite SSH come root.
- Rimuovere il nodo problematico dal cluster eseguendo il comando vracli cluster remove <NODE-FQDN>.
- Accedere alla riga di comando di Automation Orchestrator Appliance del nodo problematico tramite SSH come root.
- Aggiungere nuovamente il nodo al cluster eseguendo il comando vracli cluster join <MASTER-DB-NODE-FQDN>.