池中的服务器可能具有启动、关闭或已禁用(管理员以管理方式禁用)状态。状态由应用于服务器池的关联运行状况监控器确定。 

NSX Advanced Load Balancer 可能会由于多种原因将服务器标记为关闭,可以通过三种不同的方式访问这些原因。所有方法显示的信息大致相同。

  • 关闭运行状况分数图标:将鼠标悬停在 UI 中的服务器红色状态图标上。



  • 关闭事件:导航到服务器、池和虚拟服务的事件。展开事件以查看完整详细信息。该信息可用于自动生成警示,并且可能会进行进一步的系统更改。有关详细信息,请参阅“警示概览”。

  • 服务器页面:导航到应用程序 > > 池名称 > 服务器 > 服务器名称。这会显示服务器的分析页面。



在此示例中,Down-HTTP 监控器将服务器标记为关闭,而“System-HTTP”监控器将服务器报告为已启动。

注:

被动监控器是一种特殊类型。被动监控器不会将服务器标记为关闭。相反,如果被动监控器检测到错误的服务器到客户端响应,该监控器将降低使用该服务器进行负载均衡的流量百分比。可以单击运行状况监控器旁边的 + 号,以显示有关服务器运行状况的其他信息。

将服务器标记为关闭的常见原因

  • 未解析 ARP:SE 无法解析服务器 IP 地址的 MAC 地址(位于同一 L2 域时)或无法启动 TCP 连接(服务器离 L3 一个跳段远时)。

  • 负载不匹配:运行状况监控器要求在响应正文(HTTP 或 TCP)中返回特定内容。在该示例中,显示了服务器的响应摘录。在服务器的第一个响应是向客户端发送重定向时,通常会出现这种类型的错误。预期的内容显示在客户端浏览器中,但从 NSX Advanced Load Balancer 的角度看,客户端收到重定向。

  • 响应代码不匹配:HTTP 运行状况检查可能配置为需要特定的响应代码,例如 2xx。同时,服务器可能发回不同的代码,例如 404。

  • 响应超时超过阈值:运行状况监控器在超时期限内等待响应,可以为每个运行状况监控器分配其自己的阈值和超时期限。如果在超时期限内连续 N 次(等于阈值)未收到有效的响应,则将服务器标记为关闭。

虽然 NSX Advanced Load Balancer 设计用于轻松进行故障排除,但有时可能需要更高级的工具。在这些情况下,捕获 SE 和服务器之间会话的痕迹可能会很有用。(导航到运维 > 流量捕获。有关更多信息,请参阅流量捕获。)

从客户机启动到服务器时,ping 和 curl 等工具非常有用。但是,当管理员从 SE 中执行时,这些工具可能并不可靠。这是因为将双网络栈用于数据平面和管理。

例如,使用 SE 管理 IP 和网络从 Linux 中执行 ping 等工具。当 SE 通过其数据网卡和网络进行运行状况检查时,结果可能不同于 SE 报告的结果。对于 ping 示例,请使用 ping -l 来验证使用的接口。