要监控 NSX 覆盖网络 Fabric 的运行状况,请查看传输节点之间的双向转发检测 (BFD) 状态。

对于在一个或多个逻辑 SPAN 上处于活动状态的所有隧道端点 (TEP),每个传输节点都会创建到这些端点的全网状 BFD 会话。NSX 显示 BFD 状态以及与传输节点相关的其他详细信息。

主机传输节点(独立主机和已注册到 vCenter 的主机)和 Edge 节点都会显示隧道状态。BFD 数据包同时支持 GENEVE 和 STT 封装。GENEVE 是默认封装。

注: 对于计算传输节点(如 ESXi 主机),如果 ESXi 的活动端口已连接到 NSX 分段,则会建立 BFD 隧道。这意味着具有 vNIC 的已打开电源的虚拟机已连接到 NSX 分段。

过程

  1. 从浏览器中,使用 admin 权限登录到 https://<nsx-manager-ip-address> 或 https://<nsx-manager-fqdn> 中的 NSX Manager
  2. 选择系统 > Fabric > 主机 > 集群
  3. 选择主机,然后单击查看详细信息
  4. 主机详细信息窗口中,选择监控,然后展开传输节点状态
  5. 选择隧道
  6. 在“隧道端点”上,根据隧道使用的封装协议筛选隧道。在 GENEVEVXLAN 之间进行选择。
  7. 按 BFD 状态筛选下拉菜单中,选择“全部”以查看所有 BFD 状态或特定状态。
    “监控”页面将显示隧道状态、BFD 诊断代码、远程节点 UUID、BFD 数据包上的封装以及隧道名称。
    隧道 BFD 诊断代码指示会话状态发生更改的原因。
    代码 描述 操作

    0

    无诊断

    代码 0:隧道启动时显示的默认诊断代码。
    1

    控制检测时间过期

    代码 1:BFD 定时器已过期。当本地接口未从远程系统收到 BFD 数据包并且 BFD 定时器过期时,会出现此问题。检查 BFD 定时器对于系统负载和路径流量负载而言是否过于严格。默认 BFD 定时器为 1 秒,最大丢失数为 3。

    更改 BFD 参数不会造成中断。

    2

    回显功能失败

    代码 2:BFD 回显数据包循环验证失败。验证传输节点的运行状况。
    3

    邻居信号会话关闭

    代码 3:对等节点主动关闭会话。检查对等传输节点是否处于维护模式或运行不正常。取消 ICMP ping 以验证与 TEP 的连接。
    4

    转发层面重置

    代码 4:当转发平面重置且对等体未在 BFD 上回复时,会话将标记为关闭
    5

    路径异常

    代码 5:远程节点的路径已关闭。使用 ICMP ping 验证 TEP 之间的 IP 连接。请注意,ESXi 上的 TEP 接口在 vxlan 网络栈和 Edge 的隧道 VRF 上已实例化。请确保从 ESXi 上的 vxlan 网络栈中或从 Edge 上的隧道 VRF 中启动 ping 操作。如果您有多个 TEP,请确保指定用于 ping 的源 IP 地址或接口。

    ESXi 主机上: ping ++netstack=vxlan -I <vmk adapter> <remote address>

    在 Edge 节点上: get logical-routers

    vrf 0

    ping <dst-vtep> source <src-vtep> repeat 3

    6

    连接路径异常

    连接路径异常表示 Edge 传输节点已断开与北向路由器的所有 BGP/OSPF(北向)会话。如果未将 Edge 集群用于 Tier-0 BGP 路由目的,而仅使用 Tier-1 服务,则可以安全地忽略此错误。
    7

    管理异常

    代码 7:管理员将会话标记为关闭。验证本地传输节点是否处于维护模式。要在 TN 上运行的 Admin CLI:get maintenance-mode
    8

    反向连接路径异常

    代码 8:从远程节点到本地的路径已关闭。测试从远程节点到本地节点的 IP 连接。

结果

Fabric 运行状况 BFD 会话是在 TEP 地址之间创建的。隧道状态真实地反映了 IP 连接情况以及网络转发 Geneve 数据包的能力,因此所有 BFD 会话的状态都应为已启动。如果 BFD 状态为已关闭,请使用诊断代码对问题进行故障排除。

要了解 Fabric 节点上 BFD 会话的状态,请运行以下 CLI 命令:

  • 对于 ESXi,请运行 nsxdp-cli bfd sessions list
  • 对于 Edge TN,请运行 get bfd-sessions

要验证传输节点的结构层运行状况,请调用以下 API:

GET /policy/api/v1/infra/sites/<site-id>/enforcement-points/<enforcement-point-id>/transport-node-status-report

其中,<site-id> 和 <enforcement-point-id> 可以使用值 default