複数ノード、高可用性 (HA) 構成の vRealize Automation アプライアンスで障害が発生した場合は、障害が発生したノードの置き換えが必要になる場合があります。

注意: VMware は、実行の前に、テクニカル サポートと連携して HA の問題のトラブルシューティングを行い、問題が 1 台のノードに隔離されているのを確認することを推奨します。

ノードの交換が必要であるとテクニカル サポートが判断した場合は、次の手順を実行します。

  1. vCenter Server で、HA 構成内にあるすべてのアプライアンスのバックアップ スナップショットを作成します。

    バックアップ スナップショットには、仮想マシンのメモリを含めないようにしてください。

  2. 障害が発生したノードをシャットダウンします。
  3. 障害が発生したノードの vRealize Automation ソフトウェア ビルド番号とネットワーク設定をメモします。

    FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスをメモします。これらと同じ値を後で置換用のノードに割り当てます。

  4. プライマリ データベース ノードのステータスを確認します。健全なノードの root コマンド ラインで、次のコマンドを実行します。
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    重要: プライマリ データベース ノードは、いずれかの健全なノードである必要があります。

    プライマリ データベース ノードに障害が発生している場合は、先に進まずにテクニカル サポートに連絡してください。

  5. 健全なノードの root コマンド ラインから、障害が発生したノードを削除します。

    vracli cluster remove faulty-node-FQDN

  6. vCenter Server を使用して、新しい vRealize Automation 置換用のノードを展開します。

    同じ vRealize Automation ソフトウェア ビルド番号を展開し、障害が発生したノードのネットワーク設定を適用します。前にメモした FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスを含めます。

  7. 置換ノードをパワーオンします。
  8. 置換ノードのコマンド ラインに root としてログインします。
  9. 次のコマンドを実行して、初期起動シーケンスが完了したことを確認します。

    vracli status first-boot

    First boot complete メッセージを探します。

  10. 置換ノードから、vRealize Automation クラスタに参加します。

    vracli cluster join primary-DB-node-FQDN

  11. プライマリ データベース ノードのコマンド ラインに root としてログインします。
  12. 次のスクリプトを実行して、修復されたクラスタを展開します。

    /opt/scripts/deploy.sh