Il ripristino di un nodo di Automation Orchestrator può causare problemi con il servizio Kubernetes.

Per ripristinare un nodo problematico nel cluster di Automation Orchestrator, è necessario individuare il nodo, rimuoverlo dal cluster e quindi aggiungerlo di nuovo al cluster.

Procedura

  1. Identificare il nodo primario del cluster di Automation Orchestrator.
    1. Accedere alla riga di comando di Automation Orchestrator Appliance di uno dei nodi tramite SSH come root.
    2. Individuare il nodo con il ruolo primary eseguendo il comando kubectl -n prelude exec postgres-0.
      kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
    3. Recuperare il nome del pod in cui si trova il nodo primario.
      Nella maggior parte dei casi, il nome del pod è postgres-0.postgres.prelude.svc.cluster.local.
    4. Individuare l'indirizzo del nome di dominio completo del nodo primario eseguendo il comando kubectl -n prelude get pods.
      kubectl -n prelude get pods -o wide
    5. Individuare il pod del database con il nome recuperato e ottenere l'indirizzo del nome di dominio completo per il nodo corrispondente.
  2. Individuare il nodo problematico eseguendo il comando kubectl -n prelude get node.
    Il nodo problematico ha stato NotReady.
  3. Accedere alla riga di comando di Automation Orchestrator Appliance del nodo primario tramite SSH come root.
  4. Rimuovere il nodo problematico dal cluster eseguendo il comando vracli cluster remove <NODE-FQDN>.
  5. Accedere alla riga di comando di Automation Orchestrator Appliance del nodo problematico tramite SSH come root.
  6. Aggiungere nuovamente il nodo al cluster eseguendo il comando vracli cluster join <MASTER-DB-NODE-FQDN>.