複数ノード、高可用性 (HA) 構成の vRealize Automation アプライアンスで障害が発生した場合は、障害が発生したノードの置き換えが必要になる場合があります。
注意:
VMware は、実行の前に、テクニカル サポートと連携して HA の問題のトラブルシューティングを行い、問題が 1 台のノードに隔離されているのを確認することを推奨します。
ノードの交換が必要であるとテクニカル サポートが判断した場合は、次の手順を実行します。
- vCenter Server で、HA 構成内にあるすべてのアプライアンスのバックアップ スナップショットを作成します。
バックアップ スナップショットには、仮想マシンのメモリを含めないようにしてください。
- 障害が発生したノードをシャットダウンします。
- 障害が発生したノードの vRealize Automation ソフトウェア ビルド番号とネットワーク設定をメモします。
FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスをメモします。これらと同じ値を後で置換用のノードに割り当てます。
- プライマリ データベース ノードのステータスを確認します。健全なノードの root コマンド ラインで、次のコマンドを実行します。
> kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
重要: プライマリ データベース ノードは、いずれかの健全なノードである必要があります。プライマリ データベース ノードに障害が発生している場合は、先に進まずにテクニカル サポートに連絡してください。
- 健全なノードの root コマンド ラインから、障害が発生したノードを削除します。
vracli cluster remove faulty-node-FQDN
- vCenter Server を使用して、新しい vRealize Automation 置換用のノードを展開します。
同じ vRealize Automation ソフトウェア ビルド番号を展開し、障害が発生したノードのネットワーク設定を適用します。前にメモした FQDN、IP アドレス、ゲートウェイ、DNS サーバ、特に MAC アドレスを含めます。
- 置換ノードをパワーオンします。
- 置換ノードのコマンド ラインに root としてログインします。
- 次のコマンドを実行して、初期起動シーケンスが完了したことを確認します。
vracli status first-boot
First boot complete
メッセージを探します。 - 置換ノードから、vRealize Automation クラスタに参加します。
vracli cluster join primary-DB-node-FQDN
- プライマリ データベース ノードのコマンド ラインに root としてログインします。
- 次のスクリプトを実行して、修復されたクラスタを展開します。
/opt/scripts/deploy.sh