NSX Edge
問題
原因
解決方案
- 執行 admin cli get bfd-sessions,以尋找已在 Edge 傳輸節點上關閉的 VTEP BFD 通道工作階段。為防止出現 VTEP 組態錯誤,當 Edge 遺失其到 Hypervisor 的所有 BFD 時,會自行關閉。
- 對於已關閉的工作階段,使用 ICMP ping 動作,來驗證 TEP 之間的 IP 連線。
備註: TEP 介面位於通道 VRF (對於 Edge) 和 vxlan Netstack (對於 ESXi) 上。因此,請從 Edge 上的通道 VRF 中來起始 ping 動作,如果有多個 TEP,請務必指定來源 IP 位址或介面,以執行 ping 動作。
- 執行 admin cli「get logical-routers」,以取得通道 VRF。
vrf 0 ping 48.13.47.8 source 48.13.46.1 repeat 3
- ESXi:ping ++netstack=vxlan <remote-vtep-ip=-address> -I vmk10 -d -s 1600
- 如 CLI 中所示,應同時指定與 BFD 工作階段相關的遠端和本機 IP 位址,來起始 ping 動作。雖然不需測試簡單的連線,仍需指定承載大小,並比 TEP 所設定的 MTU 少 100 位元組,以及將 dfbit 設定為 [啟用],以防止底層網路將封包分段。當使用更大的承載進行測試時,將會驗證底層網路是否已適當設定為支援您的 NSX Geneve 覆疊組態。
- 驗證是否正在解析芳鄰 VTEP 位址的 ARP。
edge-1(vrf)> get neighbor Logical Router UUID : 736a80e3-23f6-5a2d-81d6-bbefb2786666 VRF : 0 LR-ID : 0 Name : Type : TUNNEL Neighbor Interface : 4d9091fe-b971-5d3c-9201-4cb9c7f455fe IP : 202.1.1.2 <------------ peer TN VTEP IP MAC : 00:50:56:a6:7d:9b <---- resolved State : reach <---------- ARP reachable state Timeout : 37
- 執行 get interface cmd,然後執行 get logical-router interface <uuid> status,以取得 VTEP 介面狀態。
Interface : ac80718b-72d3-5028-bb07-8f3c4ea2231a Ifuid : 258 Name : Fwd-mode : IPV4_AND_IPV6 Internal name : uplink-258 Mode : lif Port-type : uplink IP/Mask : 71.23.46.1/24 MAC : 00:50:56:b8:2c:c4 VLAN : 2046 Access-VLAN : untagged LS port : d31578e5-bc91-5466-97c1-8e4a6aa1b2e8 Urpf-mode : PORT_CHECK DAD-mode : LOOSE RA-mode : RA_INVALID Admin : up Op_state : up Enable-mcast : True MTU : 8800 arp_proxy
- 執行 get bfd-session stats,以尋找 [RX 捨棄數] 和 [TX 遺漏數] 計數器值。
- 如果 ICMP ping 動作失敗或 ARP 無法連線,請驗證底層連線和對等主機 TEP 介面位址是否有效。如果大型封包 MTU ping 動作失敗,請修正 NSX 網狀架構和/或底層基礎結構 MTU,以更正值。
- 確認 Edge TEP 位址未由其他傳輸節點使用,並確認 Edge TEP VLAN 和主機 TEP VLAN 未使用相同的 VLAN 和上行。