A restauração de um nó do Automation Orchestrator pode causar problemas com o serviço do Kubernetes.
Para recuperar um nó problemático no seu cluster do Automation Orchestrator, você deve localizar o nó, removê-lo do cluster e, em seguida, adicioná-lo ao cluster novamente.
Procedimento
- Identifique o nó primário do seu cluster do Automation Orchestrator .
- Faça login na linha de comando do Automation Orchestrator Appliance de um dos nós pelo SSH como raiz.
- Localize o nó com a função
primary
executando o comando kubectl -n prelude exec postgres-0.
kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
- Recupere o nome do pod no qual o nó primário está localizado.
Na maioria dos casos, o nome do pod é
postgres-0.postgres.prelude.svc.cluster.local
.
- Localize o endereço FQDN do nó primário executando o comando kubectl -n prelude get pods.
kubectl -n prelude get pods -o wide
- Localize o pod do banco de dados com o nome que você recuperou e obtenha o endereço FQDN para o nó correspondente.
- Localize o nó problemático executando o comando kubectl -n prelude get node.
O nó problemático tem um status
NotReady
.
- Faça login na linha de comando do Automation Orchestrator Appliance do nó primário pelo SSH como raiz.
- Remova o nó problemático do cluster executando o comando vracli cluster remove <NODE-FQDN>.
- Faça login na linha de comando do Automation Orchestrator Appliance do nó problemático pelo SSH como raiz.
- Adicione o nó ao cluster novamente executando o comando vracli cluster join <MASTER-DB-NODE-FQDN>.