Восстановление узла Automation Orchestrator может привести к ошибкам в службе Kubernetes.

Чтобы восстановить проблемный узел в кластере Automation Orchestrator, необходимо найти этот узел, удалить его из кластера, а затем снова добавить в кластер.

Процедура

  1. Определите основной узел кластера Automation Orchestrator.
    1. а. Войдите в командную строку Automation Orchestrator Appliance одного из узлов по протоколу SSH в качестве пользователя root.
    2. б. Найдите узел с ролью primary, выполнив команду kubectl -n prelude exec postgres-0.
      kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
    3. в. Получите имя модуля, в котором находится основной узел.
      В большинстве случаев имя модуля — postgres-0.postgres.prelude.svc.cluster.local.
    4. г. Найдите полное доменное имя основного узла, выполнив команду kubectl -n prelude get pods.
      kubectl -n prelude get pods -o wide
    5. д. Найдите модуль базы данных с этим именем и получите полное доменное имя для соответствующего узла.
  2. Определите, где находится проблемный узел, выполнив команду kubectl -n prelude get node.
    Проблемный узел имеет состояние NotReady.
  3. Войдите в командную строку Automation Orchestrator Appliance основного узла по протоколу SSH в качестве пользователя root.
  4. Удалите проблемный узел из кластера, выполнив команду vracli cluster remove <NODE-FQDN>.
  5. Войдите в командную строку Automation Orchestrator Appliance проблемного узла по протоколу SSH в качестве пользователя root.
  6. Снова добавьте узел в кластер, выполнив команду vracli cluster join <MASTER-DB-NODE-FQDN>.