複数ノード、高可用性 (HA) 構成の VMware Aria Automation アプライアンスで障害が発生した場合は、障害が発生したノードの置き換えが必要になる場合があります。

注意: VMware は、実行の前に、テクニカル サポートと連携して HA の問題のトラブルシューティングを行い、問題が 1 台のノードに隔離されているのを確認することを推奨します。

ノードの交換が必要であるとテクニカル サポートが判断した場合は、次の手順を実行します。

  1. vCenter Server で、HA 構成内にあるすべてのアプライアンスのバックアップ スナップショットを作成します。

    バックアップ スナップショットには、仮想マシンのメモリを含めないようにしてください。

  2. 障害が発生したノードをシャットダウンします。
  3. 障害が発生したノードの VMware Aria Automation ソフトウェア ビルド番号とネットワーク設定をメモします。

    FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスをメモします。これらと同じ値を後で置換用のノードに割り当てます。

  4. プライマリ データベース ノードのステータスを確認します。健全なノードの root コマンド ラインで、次のコマンドを実行します。
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    重要: プライマリ データベース ノードは、いずれかの健全なノードである必要があります。

    プライマリ データベース ノードに障害が発生している場合は、先に進まずにテクニカル サポートに連絡してください。

  5. 健全なノードの root コマンド ラインから、障害が発生したノードを削除します。

    vracli cluster remove faulty-node-FQDN

  6. vCenter Server を使用して、新しい VMware Aria Automation 置換用のノードを展開します。

    同じ VMware Aria Automation ソフトウェア ビルド番号を展開し、障害が発生したノードのネットワーク設定を適用します。前にメモした FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスを含めます。

  7. 置換ノードをパワーオンします。
  8. 置換ノードのコマンド ラインに root としてログインします。
  9. 次のコマンドを実行して、初期起動シーケンスが完了したことを確認します。

    vracli status first-boot

    First boot complete メッセージを探します。

  10. 置換ノードから、VMware Aria Automation クラスタに参加します。

    vracli cluster join primary-DB-node-FQDN

  11. プライマリ データベース ノードのコマンド ラインに root としてログインします。
  12. 次のスクリプトを実行して、修復されたクラスタを展開します。

    /opt/scripts/deploy.sh