Automation Orchestrator 노드를 복원하면 Kubernetes 서비스에 문제가 발생할 수 있습니다.
Automation Orchestrator 클러스터에서 문제가 있는 노드를 복구하려면 노드를 찾아서 클러스터에서 제거한 다음 클러스터에 다시 추가해야 합니다.
프로시저
- Automation Orchestrator 클러스터의 기본 노드를 식별합니다.
- SSH를 통해 기본 노드의 Automation Orchestrator Appliance 명령줄에 루트로 로그인합니다.
- kubectl -n prelude exec postgres-0 명령을 실행하여
primary
역할이 있는 노드를 찾습니다.
kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
- 기본 노드가 있는 포드의 이름을 검색합니다.
대부분의 경우 포드 이름은
postgres-0.postgres.prelude.svc.cluster.local
입니다.
- kubectl -n prelude get pods 명령을 실행하여 기본 노드의 FQDN 주소를 찾습니다.
kubectl -n prelude get pods -o wide
- 검색한 이름으로 데이터베이스 포드를 찾고 해당 노드의 FQDN 주소를 가져옵니다.
- kubectl -n prelude get node 명령을 실행하여 문제가 있는 노드를 찾습니다.
문제가 있는 노드의 상태가
NotReady
상태입니다.
- SSH를 통해 기본 노드의 Automation Orchestrator Appliance 명령줄에 root로 로그인합니다.
- vracli cluster remove <NODE-FQDN> 명령을 실행하여 문제가 있는 노드를 클러스터에서 제거합니다.
- SSH를 통해 기본 노드의 Automation Orchestrator Appliance 명령줄에 루트로 로그인합니다.
- vracli cluster join <MASTER-DB-NODE-FQDN> 명령을 실행하여 클러스터에 노드를 다시 추가합니다.