このシナリオでは、計画されたメンテナンスまたは突然の電源障害でプライマリ サイト 1 が停止した場合について考えてみます。すべてのワークロードがセカンダリ サイト 2(昇格したプライマリ サイト)で実行され、トラフィックがサイト 2 のユニバーサル分散論理ルーターと NSX Edge 経由でルーティングされます。元のプライマリ サイト 1 が再起動した後、NSX 管理者が NSX コンポーネントを復旧し、すべてのワークロードを元のプライマリ サイト 1 にリストアします。

NSX 管理者の主な達成目標は次のとおりです。
  • 最小限のダウンタイムで、サイト 2 から元のプライマリ サイト 1 にすべてのワークロードを完全にフェイルバックする。
  • サイト 1 へのフェイルバック後もアプリケーションの IP アドレスを維持する。
  • サイト 1 で、すべての Edge インターフェイスの設定と BGP プロトコルの設定を自動的に復旧する。
注:
  • 管理者は、vSphere Web Client を使用するか、NSX REST API を実行して、フェイルバック タスクを手動で実行できます。また、フェイルバック中に実行される API を含むスクリプト ファイルを実行して、いくつかのフェイルバック タスクを自動化できます。このシナリオでは、vSphere Web Client を使用してフェイルバックを手動で行う手順について説明します。CLI または NSX REST API のいずれかが必要になる場合には、適切な手順を説明します。
  • このシナリオで使用するディザスタ リカバリのワークフローは、以前に説明したトポロジに固有のものです。このトポロジは、プライマリ NSX Manager と 1 つのセカンダリ NSX Manager から構成されています。複数のセカンダリ NSX Manager を使用するワークフローは、このシナリオの範囲外です。

前提条件

  • サイト 1 とサイト 2 の両方に NSX Data Center 6.4.5 以降がインストールされている。
  • サイト 1 とサイト 2 の vCenter Server が拡張リンク モードで展開されている。
  • サイト 1 とサイト 2 が次の条件を満たしている。
    • NSX 以外のファイアウォールが存在する場合、そのファイアウォールにアプリケーション固有のセキュリティ ポリシーが設定されていない。
    • NSX 以外のファイアウォールが存在する場合、そのファイアウォールにアプリケーション固有のファイアウォール ルールが設定されていない。
    • ユニバーサル分散論理ルーターで ECMP を有効にして、すべてのトラフィックを許可するため、両方の ESG でファイアウォールが無効になっている。
  • サイト 2(プライマリに昇格)で、フェイルバック プロセスの前にユニバーサル論理スイッチが変更されていない。

手順

  1. プライマリ サイト 1 が再起動したら、NSX Manager とコントローラ クラスタ ノードがパワーオンされ、実行中であることを確認します。
    1. [ネットワークとセキュリティ (Networking & Security)] > [ダッシュボード (Dashboard)] > [概要 (Overview)] の順にクリックします。
    2. ドロップダウン メニューからプライマリ NSX Manager を選択します。
    3. [システムの概要] ペインで、NSX Manager とコントローラ クラスタ ノードのステータスを確認します。
      NSX Manager とコントローラ ノードの横にある緑色のドットは、両方の NSX コンポーネントがパワーオンされ、実行されていることを意味します。
  2. フェイルバック プロセスを開始する前に、次のことを確認します。
    1. [インストールとアップグレード] ページで、[管理 (Management)] > [NSX Manager (NSX Managers)] の順に移動し、両方のサイトの NSX Manager にプライマリ ロールがあることを確認します。
    2. [NSX Controller ノード] ページで、両方のサイトにユニバーサル コントローラ クラスタ (UCC) ノードが存在することを確認します。
  3. サイト 2(昇格したプライマリ)に関連付けられた 3 台の UCC ノードをすべてシャットダウンします。
  4. [NSX Controller ノード] ページで、サイト 2(昇格したプライマリ)に関連付けられた 3 台の UCC ノードをすべて削除します。
    ヒント: NSX REST API を使用すると、コントローラ ノードを 1 台ずつ削除できます。この操作を行うには、 https://NSX_Manager_IP/api/2.0/vdn/controller/{controllerID} API 呼び出しを実行します。ただし、最後のコントローラ ノードを強制的に削除するには、 https://NSX_Manager_IP/api/2.0/vdn/controller/{controllerID}?forceRemoval=true API 呼び出しを実行します。
  5. 次の手順に進む前に、サイト 2(昇格したプライマリ)でユニバーサル コンポーネントが変更されていないことを確認します。
  6. サイト 2(昇格したプライマリ)の NSX Manager でプライマリ ロールを削除します。
    1. [インストールとアップグレード] ページで、[管理 (Management)] > [NSX Manager (NSX Managers)] の順に移動します。
    2. サイト 2 の NSX Manager を選択して、[アクション (Actions)] > [プライマリ ロールの削除 (Remove Primary Role)] の順に選択します。
      メッセージが表示され、プライマリ ロールを削除する前にサイト 2 の NSX Manager が所有するコントローラが削除されていることを確認するように求められます。
    3. [はい (Yes)] をクリックします。
      サイト 2 の NSX Manager が移行ロールに切り替わります。
  7. サイト 1 のプライマリ NSX Manager で、関連するセカンダリ NSX Manager を削除します。
    1. [NSX Manager] 画面で、サイト 1 に関連付けられている NSX Manager を選択します。
    2. [アクション (Actions)] > [セカンダリ NSX Manager の削除 (Remove Secondary Manager)] の順にクリックします。
    3. [NSX Manager にアクセスできない場合でも操作を実行 (Perform Operation even if NSX Manager is inaccessible)] チェック ボックスを選択します。
    4. [削除 (Remove)] をクリックします。
  8. サイト 1 のプライマリ NSX Manager のセカンダリとしてサイト 2 の NSX Manager(移行モード)を登録します。
    注意: ユニバーサル分散論理ルーターの制御仮想マシン(Edge アプライアンスの仮想マシン)で Local Egress が無効になっているため、制御仮想マシンが自動的に削除されます。したがって、セカンダリ ロールを持つサイト 2 の NSX Manager(現在は移行ロール)を登録する前に、サイト 2 のコントローラ クラスタ ノードが削除されていることを確認します。コントローラ クラスタ ノードが削除されていないと、ネットワーク トラフィックの中断が発生します。
    1. [インストールとアップグレード] 画面で、[管理 (Management)] > [NSX Manager (NSX Managers)] の順に移動します。
    2. サイト 1 に関連付けられている NSX Manager を選択します。
    3. [アクション (Actions)] > [セカンダリ NSX Manager の追加 (Add Secondary Manager)] の順にクリックします。
    4. サイト 2 に関連付けられている NSX Manager を選択します。
    5. サイト 2 の NSX Manager のユーザー名とパスワードを入力し、セキュリティ証明書を受け入れます。
    6. [追加 (Add)] をクリックします。
    これらすべての手順が完了したら、次の結果を確認します。
    • サイト 1 の NSX Manager がプライマリ ロールで、サイト 2 の NSX Manager がセカンダリ ロールになっている。
    • サイト 2 の NSX Manager で、3 台のシャドウ コントローラ ノードのステータスが「切断」と表示されます。次のメッセージが表示されます。プライマリ NSX Manager またはスタンドアローン NSX Manager でのみ、コントローラ クラスタのプロパティの読み取りまたは更新を行うことができます。

      このメッセージは、サイト 2 のセカンダリ NSX Manager がサイト 1 のプライマリ NSX Manager のユニバーサル コントローラ クラスタ ノードと接続できないことを意味します。ただし、数秒後に接続が再度確立し、ステータスが「接続中」に変わります。

  9. サイト 1 でユニバーサル分散論理ルーターと NSX Edge の制御仮想マシン(Edge アプライアンスの仮想マシン)をパワーオンします。
    1. [ネットワーク (Networking)] > [仮想マシン (VMs)] > [仮想マシン (Virtual Machines)] の順に移動します。
    2. ユニバーサル分散論理ルーターの制御仮想マシンの仮想マシン名(仮想マシン ID)を右クリックし、[パワーオン (Power on)] をクリックします。
    3. パワーオンする Edge 仮想マシンに手順 (b) を繰り返します。
    4. 次の手順に進む前に、ユニバーサル分散論理ルーターの制御仮想マシンと Edge 仮想マシンが起動し、実行されるまで待機します。
  10. サイト 2 のセカンダリ NSX Manager に関連付けられているユニバーサル分散論理ルーターの制御仮想マシン(Edge アプライアンスの仮想マシン)が自動的に削除されたことを確認します。
    1. [ネットワークとセキュリティ (Networking & Security)] > [NSX Edge (NSX Edges)] の順に移動します。
    2. セカンダリ NSX Manager 選択して、ユニバーサル分散論理ルーターをクリックします。
    3. [ステータス] ページで、ユニバーサル分散論理ルーターに Edge アプライアンス仮想マシンが展開されていないことを確認します。
  11. コントローラ サービスがセカンダリ サイト 2 と同期するように、プライマリ サイト 1 で NSX Controller の状態を更新します。
    1. [インストールとアップグレード] 画面で、[NSX Manager (NSX Managers)] をクリックします。
    2. サイト 1 のプライマリ NSX Manager を選択します。
    3. [アクション (Actions)] > [コントローラ状態の更新 (Update Controller State)] の順に選択します。
  12. サイト 2 から サイト 1 にワークロード仮想マシンを移行します。
    注: ワークロード仮想マシンは引き続きサイト 2 に存在します。このため、ワークロード仮想マシンをサイト 1 に手動で移行する必要があります。

結果

セカンダリ サイト(サイト 2)からプライマリ サイト(サイト 1)にすべての NSX コンポーネントが手動でフェイルバックされました。

次のタスク

サイト 1 で次の操作を行い、プライマリ サイト 1 へのフェイルバックが 100% 完了しているかどうか確認します。
  1. NSX Manager がプライマリ ロールを持っているかどうか確認します。
  2. ユニバーサル分散論理ルーターに制御仮想マシン(Edge アプライアンスの仮想マシン)が展開されているかどうか確認します。
  3. すべてのコントローラ クラスタ ノードのステータスが「接続中」になっているかどうか確認します。
  4. NSX に準備されたホスト クラスタごとに通信の健全性チェックを実行します。
    1. [インストールとアップグレード (Installation and Upgrade)] > [ホストの準備 (Host Preparation)] の順に移動します。
    2. サイト 1 の NSX Manager を選択します。
    3. 一度に 1 つのクラスタを選択して、クラスタの通信チャネルの健全性ステータスが UP になっているかどうかを確認します。
    4. クラスタ内のホストごとに、ホストの通信チャネルの健全性ステータスが UP になっているかどうか確認します。
    5. ホストの準備のステータスが Green になっているかどうか確認します。
  5. ユニバーサル分散論理ルーターの制御仮想マシン(Edge アプライアンスの仮想マシン)の CLI コンソールにログインして、次の操作を行います。
    1. show ip bgp neighbors コマンドを実行して、すべての BGP ネイバーが確立され、ステータスが UP になっているかどうか確認します。
    2. show ip route bgp コマンドを実行して、すべての BGP ルートがすべての BGP ネイバーから学習されているかどうか確認します。

サイト 1 へのフェイルバックが完了すると、プライマリ サイト 1 ですべてのワークロードが実行され、サイト 1 のユニバーサル分散論理ルーターと NSX Edge を介してトラフィックがルーティングされます。