在 NSX 聯盟環境中,當我們對每個區段使用延伸覆疊區段時,每個區段都有一個作用中 SR 和一個待命 SR 在 NSX Edge 節點上執行。

當作用中 NSX Edge 節點發生故障時,NSX 控制平面可確保流量容錯移轉到待命 NSX Edge 節點,並將所有傳輸節點流量分別轉送到新的作用中 NSX Edge 節點。

檢視一個拓撲,其中您在 NSX 聯盟環境中建立了跨多個站台的 L2 延伸覆疊區段,每個區段均依賴於兩個以作用中/待命組態執行的 NSX Edge 節點來處理跨站台流量。例如,如圖 1 所示,NSX Edge 1 為作用中節點,NSX Edge 2 為待命節點。相應地,作用中 NSX Edge 的 VTEP 將作為所有 ESXi 傳輸節點的跨站台流量的作用中 L2 轉寄站。

為確保 NSX Edge 節點的 HA 功能,每個 NSX Edge 節點都會將 HA 狀態傳達給中央控制平面,讓其瞭解哪個節點是作用中 NSX Edge。接著,控制平面將從 NSX Edge 節點接收到的 VTEP 群組成員資格和 HA 狀態資訊傳達給所有裝載這些延伸區段的傳輸節點。

輸出會顯示這兩個 NSX Edge 節點的 HA 狀態。失效記錄為 False,表示 HA 狀態準確。

若要檢視容錯移轉後的作用中 Edge VTEP 的 HA 狀態,請遵循下列程序:

備註: 此程序適用於所有在聯盟環境中使用的 NSX 延伸區段。

必要條件

程序

  1. 複製已連結至第 1 層或第 0 層閘道的延伸區段的 UUID。
  2. 定義哪個是區段所連接的特定 T1 閘道的作用中 Edge。
  3. 您也可以使用以下 API 獲取特定區段的作用中/待命 Edge。
    /infra/segments/<segment-id>/inter-site-forwarder/site-span-info
  4. 以 admin 使用者密碼連線至 Edge。
  5. 執行 get vtep-group,瞭解存在於 NSX Edge 節點上的 VTEP 群組。
  6. 驗證 get vtep-group 命令的輸出是否包含延伸區段 UUID。
  7. 複製與該區段對應的 VTEP 群組識別碼。
  8. 在 NSX Manager 節點的 CLI 終端機中,執行 get vtep-group <vtep-group-ID> vteps-staleness-status
    VNI       IP                   MAC            LABEL       Segment      TransportNode-Id                      TN-Connection   HA-STATE  STALE-RECORD
    
    26625     172.20.1.151     00:0c:29:9e:64:5e      0x18001    172.20.1.0   32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE     False
    26625     172.20.1.152     00:0c:29:ea:8e:aa      0xFC01     172.20.1.0   914d0362-32bc-11ee-ba27-000c29ea8ea0        true        STANDBY     False
    

  9. 執行 get vtep-group,瞭解存在於 NSX Edge 節點上的 VTEP 群組。
  10. 驗證 get vtep-group 命令的輸出是否包含延伸區段 UUID。
  11. 複製該區段的對應 VTEP-Group ID
  12. 在 NSX Manager 節點的 CLI 終端機中,執行 get vtep-group <vtep-group-ID> vteps-staleness-status
    VNI           IP                   MAC            LABEL       Segment      TransportNode-Id                      TN-Connection   HA-STATE  STALE-RECORD
    26625     172.20.1.151     00:0c:29:9e:64:5e      0x18001    172.20.1.0   32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE     False
    26625     172.20.1.152     00:0c:29:ea:8e:aa      0xFC01     172.20.1.0   914d0362-32bc-11ee-ba27-000c29ea8ea0        true        STANDBY     False
    輸出會顯示這兩個 NSX Edge 節點的 HA 狀態。失效記錄為 False,表示 HA 狀態準確。
  13. 確認其中一個 NSX Edge 節點處於作用中狀態,而另一個節點處於待命模式。
  14. 如果作用中 NSX Edge 關閉,HA 狀態模式會變更。待命節點會變成作用中節點。
  15. 執行 get vtep-group <vtep-group-ID> vteps-staleness-status
     VNI        IP                  MAC              LABEL       Segment        TransportNode-Id                     TN-Connection   HA-STATE  STALE-RECORD
     26625   172.20.1.151    00:0c:29:9e:64:5e       0x18001    172.20.1.0    32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE      True
     26625   172.20.1.152    00:0c:29:ea:8e:aa       0xFC01     172.20.1.0    914d0362-32bc-11ee-ba27-000c29ea8ea0        true         ACTIVE     False

    在輸出中,位址為 172.20.1.151NSX Edge 已關閉,因此 Stale-RecordTrue

結果

NSX 控制平面會確定 NSX Edge 失敗節點的失效項目已正確記錄在 VTEP 群組的輸出中。