NSX Edge

問題

由於指向遠端 NSX Edge 的 BFD 通道已關閉,NSX Edge 的狀態為 [關閉] 或 [已降級]。

原因

在兩個 NSX Edge 之間,管理介面上會執行一個 BFD 工作階段,且每個 VTEP 介面上會執行一或多個 BFD 工作階段。僅當與該 Edge (管理工作階段和所有 VTEP 工作階段) 的所有 BFD 工作階段均已關閉時,NSX Edge 才會將其對等視為無法連線。

解決方案

  1. 若要取得 NSX Edge VTEP 裝置的相關資訊,請執行 admin cli get host-switch
  2. 若要驗證實體連接埠的狀態,請執行 get physical-port <vtep device>。然後執行 edge-1> get phy fp-eth0
    Physical Port 
    ADMIN_STATUS : up <----------------- should be "up" 
    DRIVER : net_vmxnet3 
    DUPLEX : full 
    ID : 0 
    LINK : up <----------------- should be "up" 
  3. 執行 admin cli get diagnosis topologyget edge-cluster status,以確認 Edge 狀況良好,且 Edge 叢集高可用性狀態為開啟、Edge 節點狀態為開啟,以及管理狀態為開啟。然後,驗證 VTEP 狀態是否為開啟,並檢查 BFD 健全狀況檢查工作階段的狀態。
    Interface          : nsx-edge-vtep 
           Device             : fp-eth0 
           Session            : 71.23.54.3:71.23.54.1 
           Status             : Unreachable 
           Interface          : nsx-edge-vtep.1 
           Device             : fp-eth1 
           Session            : 71.23.54.4:71.23.54.2 
           Status             : Unreachable 
    如果狀態為 [無法連線] 或 [芳鄰信號關閉],請使用 ICMP Ping 來驗證 IP 連線。
    對於所有其他狀態,請查看指南中的 BFD 錯誤碼說明。請參閱 檢視雙向轉送偵測狀態
  4. 由於 TEP 介面位於 Edge 的通道 VRF 上,因此請從 Edge 上的通道 VRF 0 來起始 ping 動作;如果您有多個 TEP,請指定用來執行 ping 動作的來源 IP 位址或介面。
  5. 執行 admin cli「get logical-routers」,以取得通道 VRF,然後執行 ping 動作。
    vrf 0 
    ping 71.23.47.8 source 71.23.46.1 repeat 3
  6. 執行 admin cli get neighbor,以檢查是否正在解析 BFD 工作階段的 ARP。
  7. 執行 admin cli get interface,針對其 BFD 通道已關閉的介面,檢查其狀態。
  8. 只要任何狀態是 [無法連線],請驗證底層連線是否正確。
  9. 如果 ICMP ping 動作運作正常,但 VTEP 狀態為 [無法連線],請驗證是否尚未使用 VTEP IP 位址。