在准备 ESXi 主机时,将使用消息总线进行 NSX Edge 通信。
在遇到问题时,NSX Manager 日志可能包含类似下面的条目:
GMT ERROR taskScheduler-6 PublishTask:963 - Failed to configure VSE-vm index 0, vm-id vm-117, edge edge-5. Error: RPC request timed out
在以下情况下,将出现该问题:
- Edge 处于错误状态
- 消息总线连接中断
要在 Edge 上诊断该问题,请执行以下操作:
- 要检查 rmq 连接,请运行以下命令:
nsxedge> show messagebus messages ----------------------- Message bus is enabled cmd conn state : listening init_req : 1 init_resp : 1 init_req_err : 0 ...
要检查 vmci 连接,请运行以下命令:
nsxedge> show messagebus forwarder ----------------------- Forwarder Command Channel vmci_conn : up app_client_conn : up vmci_rx : 3649 vmci_tx : 3648 vmci_rx_err : 0 vmci_tx_err : 0 vmci_closed_by_peer: 8 vmci_tx_no_socket : 0 app_rx : 3648 app_tx : 3649 app_rx_err : 0 app_tx_err : 0 app_conn_req : 1 app_closed_by_peer : 0 app_tx_no_socket : 0 ----------------------- Forwarder Event Channel vmci_conn : up app_client_conn : up vmci_rx : 1143 vmci_tx : 13924 vmci_rx_err : 0 vmci_tx_err : 0 vmci_closed_by_peer: 0 vmci_tx_no_socket : 0 app_rx : 13924 app_tx : 1143 app_rx_err : 0 app_tx_err : 0 app_conn_req : 1 app_closed_by_peer : 0 app_tx_no_socket : 0 ----------------------- cli_rx : 1 cli_tx : 1 cli_tx_err : 0 counters_reset : 0
在该示例中,输出 vmci_closed_by_peer: 8 表示主机代理关闭连接的次数。如果该数字不断增加并且 vmci conn 为 down,则主机代理无法连接到 RMQ 代理。在 show log follow 中,在 Edge 日志中查找重复的错误:VmciProxy: [daemon.debug] VMCI Socket is closed by peer
要在 ESXi 主机上诊断该问题,请执行以下操作:
- 要检查 ESXi 主机是否连接到 RMQ 代理,请运行以下命令:
esxcli network ip connection list | grep 5671 tcp 0 0 10.32.43.4:43329 10.32.43.230:5671 ESTABLISHED 35854 newreno vsfwd tcp 0 0 10.32.43.4:52667 10.32.43.230:5671 ESTABLISHED 35854 newreno vsfwd tcp 0 0 10.32.43.4:20808 10.32.43.230:5671 ESTABLISHED 35847 newreno vsfwd tcp 0 0 10.32.43.4:12486 10.32.43.230:5671 ESTABLISHED 35847 newreno vsfwd