Automation Orchestrator ノードをリストアすると、Kubernetes サービスで問題が発生する可能性があります。

Automation Orchestrator クラスタ内の問題のあるノードをリカバリするには、ノードを見つけてクラスタから削除し、クラスタに再度追加する必要があります。

手順

  1. Automation Orchestrator クラスタのプライマリ ノードを特定します。
    1. SSH を使用して、いずれかのノードの Automation Orchestrator Appliance コマンド ラインに root としてログインします。
    2. primary コマンドを実行して、kubectl -n prelude exec postgres-0 ロールを持つノードを見つけます。
      kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
    3. プライマリ ノードが配置されているポッドの名前を取得します。
      ほとんどの場合、ポッドの名前は postgres-0.postgres.prelude.svc.cluster.local です。
    4. kubectl -n prelude get pods コマンドを実行して、プライマリ ノードの FQDN アドレスを見つけます。
      kubectl -n prelude get pods -o wide
    5. 取得した名前のデータベース ポッドを検索し、対応するノードの FQDN アドレスを取得します。
  2. kubectl -n prelude get node コマンドを実行して、問題のあるノードを見つけます。
    問題のあるノードのステータスは NotReady です。
  3. SSH を使用して、プライマリ ノードの Automation Orchestrator Appliance コマンド ラインに root としてログインします。
  4. vracli cluster remove <NODE-FQDN> コマンドを実行して、問題のあるノードをクラスタから削除します。
  5. SSH を使用して、問題のあるノードの Automation Orchestrator Appliance コマンド ラインに root としてログインします。
  6. vracli cluster join <MASTER-DB-NODE-FQDN> コマンドを実行して、ノードをクラスタに再度追加します。