NSX Edge

問題

原因

解決方案

  1. 執行 admin cli get bfd-sessions,以尋找已在 Edge 傳輸節點上關閉的 VTEP BFD 通道工作階段。為防止出現 VTEP 組態錯誤,當 Edge 遺失其到 Hypervisor 的所有 BFD 時,會自行關閉。
  2. 對於已關閉的工作階段,使用 ICMP ping 動作,來驗證 TEP 之間的 IP 連線。
    備註: TEP 介面位於通道 VRF (對於 Edge) 和 vxlan Netstack (對於 ESXi) 上。因此,請從 Edge 上的通道 VRF 中來起始 ping 動作,如果有多個 TEP,請務必指定來源 IP 位址或介面,以執行 ping 動作。
  3. 執行 admin cli「get logical-routers」,以取得通道 VRF。
    vrf 0 
    	ping 48.13.47.8 source 48.13.46.1 repeat 3  
  4. ESXi:ping ++netstack=vxlan <remote-vtep-ip=-address> -I vmk10 -d -s 1600
  5. 如 CLI 中所示,應同時指定與 BFD 工作階段相關的遠端和本機 IP 位址,來起始 ping 動作。雖然不需測試簡單的連線,仍需指定承載大小,並比 TEP 所設定的 MTU 少 100 位元組,以及將 dfbit 設定為 [啟用],以防止底層網路將封包分段。當使用更大的承載進行測試時,將會驗證底層網路是否已適當設定為支援您的 NSX Geneve 覆疊組態。
  6. 驗證是否正在解析芳鄰 VTEP 位址的 ARP。
    edge-1(vrf)> get neighbor 
    Logical Router 
    UUID    : 736a80e3-23f6-5a2d-81d6-bbefb2786666 
    VRF     : 0 
    LR-ID   : 0 
    Name    : 
    Type    : TUNNEL 
    Neighbor 
       Interface : 4d9091fe-b971-5d3c-9201-4cb9c7f455fe 
       IP        : 202.1.1.2 <------------ peer TN VTEP IP 
       MAC       : 00:50:56:a6:7d:9b <---- resolved 
       State     : reach <---------- ARP reachable state 
       Timeout   : 37 
  7. 執行 get interface cmd,然後執行 get logical-router interface <uuid> status,以取得 VTEP 介面狀態。
      Interface    : ac80718b-72d3-5028-bb07-8f3c4ea2231a 
       Ifuid        : 258 
       Name         : 
       Fwd-mode     : IPV4_AND_IPV6 
       Internal name : uplink-258 
       Mode         : lif 
       Port-type    : uplink 
       IP/Mask      : 71.23.46.1/24 
       MAC          : 00:50:56:b8:2c:c4 
       VLAN         : 2046 
       Access-VLAN  : untagged 
       LS port      : d31578e5-bc91-5466-97c1-8e4a6aa1b2e8 
       Urpf-mode    : PORT_CHECK 
       DAD-mode     : LOOSE 
       RA-mode      : RA_INVALID 
       Admin        : up 
       Op_state     : up 
       Enable-mcast : True 
       MTU          : 8800 
       arp_proxy  

  8. 執行 get bfd-session stats,以尋找 [RX 捨棄數] 和 [TX 遺漏數] 計數器值。
  9. 如果 ICMP ping 動作失敗或 ARP 無法連線,請驗證底層連線和對等主機 TEP 介面位址是否有效。如果大型封包 MTU ping 動作失敗,請修正 NSX 網狀架構和/或底層基礎結構 MTU,以更正值。
  10. 確認 Edge TEP 位址未由其他傳輸節點使用,並確認 Edge TEP VLAN 和主機 TEP VLAN 未使用相同的 VLAN 和上行。