NSX Edge 傳輸節點與控制器的連線已關閉。

問題

原因

當與管理程式的連線已啟動,但與控制器的連線已關閉時,就會出現此問題。Admin 命令「get managers」傳回作用中的管理程式節點,而命令「get controllers」對於這個傳輸節點,卻沒有傳回任何處於「已連線」狀態和/或「已啟動」工作階段狀態的作用中控制器。

解決方案

  1. 使用 Admin CLI get maintenance-mode 或執行 API GET api/v1/transport-nodes/<tn-uuid>| state | status,確認傳輸節點未處於 NSX 維護模式。
  2. 執行 API GET /api/v1/configs/management,來驗證是否已設定 FQDN 內容 (供傳輸節點用來聯繫 NSX Manager/控制器),並檢視 publish_FQDNS 的值。
  3. 若已設定 FQDN,請驗證控制器 FQDN 是否可以連線,以及 TN 是否使用 FQDN 值來聯繫控制器,其作法是先對控制器 FQDN 執行 ICMP ping 動作,然後執行 Admin CLI get controllers,以驗證是否正確填入了控制器 FQDN 值。
  4. 遵循上述的節點代理程式疑難排解步驟,驗證節點代理程式服務是否正在執行。
  5. 如果 Edge 傳輸節點處於 NSX 維護模式,請執行 Admin CLI set maintenance-mode false 或 API POST /api/v1/transport-nodes/<node-id>?action=exit_maintenance_mode,讓該節點退出 NSX 維護模式
  6. 如果設定了 FQDN,且 ICMP ping 適用於控制器 FQDN,請嘗試取消設定再重新設定 FQDN 內容,其做法是執行 API PUT /api/v1/configs/management,並將 publish_fqdns 的值設定為 false,然後再次執行該 API,並將值設定為 true。
  7. 執行 get edge diagnosis config,以驗證 NSX Edge 節點上是否正在執行代理程式服務。若有服務顯示為 [失敗],請執行 Admin CLI start service <service-name> 或 root CLI etc/init.d/<service-name> start,來重新啟動該服務。