本节提供了有关确定 NSX Controller 故障原因和排除控制器故障的信息。 了解控制器集群架构 NSX Controller 集群表示一个横向扩展分布式系统,将为其中的每个控制器节点分配一组角色,这些角色定义了该节点可以执行的任务类型。为了提高弹性和性能,应该在三个不同的主机中部署控制器虚拟机。 NSX Controller 部署问题NSX Controller 是 NSX Manager 使用 OVA 格式部署的。具有控制器集群可以提供高可用性。部署控制器要求 NSX Manager、vCenter Server 和 ESXi 主机配置了 DNS 和 NTP。必须使用静态 IP 池为每个控制器分配 IP 地址。 磁盘延迟故障排除您可以从管理 (Management)选项卡中查看磁盘延迟警示。NSX Controller 必须在具有较低延迟的磁盘上运行。 NSX Controller 群集故障当其中一个 NSX Controller 节点出现故障时,仍会有两个控制器在工作。此时群集的大多数节点保持工作,并且控制层面仍继续正常工作。 NSX Controller 已断开连接如果从 vCenter Server 中关闭 NSX Controller 虚拟机电源或从 vCenter Server 中删除控制器虚拟机,安装和升级 (Installation and Upgrade) > 管理 (Management)页面的状态 (Status)列将显示不同步 (Out of sync)状态。 控制层面代理 (netcpa) 问题在 NSX Data Center for vSphere 上,控制层面 (netcpa) 用作本地代理守护进程,从而与 NSX Manager 和控制器群集进行通信。通信通道运行状况 (Communication Channel Health)是一项运行状况检查功能,会定期向 NSX Manager 报告中央控制层面到本地控制层面的状态并显示在 NSX Manager UI 中。该报告还作为检测信号以检测 NSX Manager 到 ESXi 主机 netcpa 通道的运行状态。它在通信故障期间提供错误详细信息,在通道进入错误状态时生成事件,以及生成从 NSX Manager 到主机的检测信号消息。