問題

  • 主機無法連線。無法完成登入,因為使用者名稱或密碼不正確。
  • 傳輸節點套用工作失敗,並顯示節點已存在的錯誤。
  • 節點處於孤立狀態。

原因

出現此問題的原因是,在流量負載繁重下出現競爭情形。執行 API GET /api/v1/transport-nodes/<TN-UUID>/status,以檢閱傳輸節點的狀態,在輸出中,傳輸節點的狀態顯示為「未知」,節點部署的狀態顯示為失敗

如果在起始 NSX 移除工作時未正確清除主機 TN,因而主機 TN 仍登錄在 NSX Manager 中,則會發生此類情況。

在這種情況下,GET 傳輸節點 API 和 GET 傳輸節點狀態 API 將失敗,但 GET 傳輸節點狀態 API 將正常運作,並顯示以下失敗訊息:無法在主機上解除安裝軟體...。API 命令是 GET /api/v1/transport-nodes/<TN-UUID>/state

解決方案

  • 若要修正失效項目的存在,您必須強制從主機中移除 NSX,並執行以下 API,以刪除設定中的失效主機項目。
    1. (NSX Manager UI) 在主機頁面上,選取強制刪除選項,然後按一下移除 NSX
    2. (API) 若要強制刪除 NSX,請執行以下 API:https://{{MPIP}}/api/v1/transport-nodes/<Transport-Node-UUID>?force=true&unprepare_host=false
    3. (API) 若要移除失效項目,請執行以下 API:https://{{nsx-mgr-ip}}/api/v1/transport-nodes?action=clean_stale_entries