本節提供對安裝問題進行疑難排解的相關資訊。
基本基礎結構服務
下列服務必須在應用裝置及 Hypervisor 上執行,同時還必須在 vCenter Server 上執行 (若用作計算管理程式)。
- NTP
- DNS
請確定防火牆未封鎖 NSX-T Data Center 元件與 Hypervisor 之間的流量。請確定元件之間已開啟所需連接埠。
若要排清 NSX Manager 上的 DNS 快取,請透過 SSH,以 root 使用者身分登入該管理員並執行下列命令:
root@nsx-mgr-01:~# /etc/init.d/resolvconf restart [ ok ] Restarting resolvconf (via systemctl): resolvconf.service.
然後,可以檢查 DNS 組態檔。
root@nsx-mgr-01:~# cat /etc/resolv.conf # Dynamic resolv.conf(5) file for glibc resolver(3) generated by resolvconf(8) # DO NOT EDIT THIS FILE BY HAND -- YOUR CHANGES WILL BE OVERWRITTEN nameserver 192.168.253.1 search mgt.sg.lab
以 root 使用者身分登入並執行 su admin,以在 NSX Manager 上啟動 nsxcli。以 admin 使用者身分登入,nsxcli 是預設提示字元。
使用以下 nsxcli 命令,來檢查 DNS 伺服器:
get name-servers198.10.10.1 198.10.10.2 198.10.10.3
檢查從主機到控制器和管理程式的通訊
在 ESXi 主機上使用
NSX-T Data Center CLI 命令:
esxi-01.corp.local> get managers - 192.168.110.19 Connected esxi-01.corp.local> get controllers Controller IP Port SSL Status Is Physical Master Session State Controller FQDN 192.168.110.16 1235 enabled connected true up NA
在 KVM 主機上使用
NSX-T Data Center CLI 命令:
kvm-01> get managers - 192.168.110.19 Connected kvm-01> get controllers Controller IP Port SSL Status Is Physical Master Session State Controller FQDN 192.168.110.16 1235 enabled connected true up NA
在 ESXi 主機上使用主機 CLI 命令:
[root@esxi-01:~] esxcli network ip connection list | grep 1235 tcp 0 0 192.168.110.53:42271 192.168.110.16:1235 ESTABLISHED 67702 newreno nsx-proxy [root@esxi-01:~] [root@esxi-01:~] esxcli network ip connection list | grep 5671 tcp 0 0 192.168.110.253:11721 192.168.110.19:5671 ESTABLISHED 2103688 newreno mpa tcp 0 0 192.168.110.253:30977 192.168.110.19:5671 ESTABLISHED 2103688 newreno mpa
在 KVM 主機上使用主機 CLI 命令:
root@kvm-01:/home/vmware# netstat -nap | grep 1235 tcp 0 0 192.168.110.55:53686 192.168.110.16:1235 ESTABLISHED 2554/nsx-proxy root@kvm-01:/home/vmware# root@kvm-01:/home/vmware# root@kvm-01:/home/vmware# netstat -nap | grep 5671 tcp 0 0 192.168.110.55:50108 192.168.110.19:5671 ESTABLISHED 2870/mpa tcp 0 0 192.168.110.55:50110 192.168.110.19:5671 ESTABLISHED 2870/mpa root@kvm-01:/home/vmware# tcpdump -i ens32 port 1235 | grep kvm-01 tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes <truncated output> 03:46:27.040461 IP nsxcontroller01.corp.local.1235 > kvm-01.corp.local.38754: Flags [P.], seq 3315301231:3315301275, ack 2671171555, win 323, length 44 03:46:27.040509 IP kvm-01.corp.local.38754 > nsxcontroller01.corp.local.1235: Flags [.], ack 44, win 1002, length 0 ^C <truncated output> root@kvm-01:/home/vmware# root@kvm-01:/home/vmware# tcpdump -i ens32 port 5671 | grep kvm-01 tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes 03:51:16.802934 IP kvm-01.corp.local.58954 > nsxmgr01.corp.local.amqps: Flags [P.], seq 1153:1222, ack 1790, win 259, length 69 03:51:16.823328 IP nsxmgr01.corp.local.amqps > kvm-01.corp.local.58954: Flags [P.], seq 1790:1891, ack 1222, win 254, length 101 ^C <truncated output>
主機登錄失敗
如果
NSX-T Data Center 使用錯誤的 IP 位址,主機登錄便會失敗。如果某個主機有多個 IP 位址,可能會發生此情況。嘗試刪除傳輸節點會使它處於孤立狀態。解決此問題:
- 在 NSX-T Data Center UI 上,編輯主機,並移除所有 IP 位址 (管理 IP 位址除外)。
- 按一下錯誤,然後選取解決。
KVM 主機問題
KVM 主機問題有時由磁碟空間不足所致。
/boot 目錄會快速填滿並導致錯誤發生,例如:
- 無法在主機上安裝軟體
- 裝置上沒有剩餘空間
您可以執行命令
df-h 來檢查可用儲存區。如果
/boot 目錄顯示為 100%,您可以執行下列操作:
- 執行 sudo dpkg --list 'linux-image*' | grep ^ii 以查看所有已安裝的核心。
- 執行 uname -r 以查看目前執行中的核心。請勿移除此核心 (linux-image)。
- 使用 apt-get purge 移除您不再需要的映像。例如,執行 sudo apt-get purge linux-image-3.13.0-32-generic linux-image-3.13.0-33-generic。
- 將主機重新開機。
- 在 NSX Manager 中,檢查錯誤並選取解決。
- 請確保虛擬機器已開啟電源。
部署 Edge 虛擬機器時的組態錯誤
部署 Edge 虛擬機器後,NSX Manager 會將虛擬機器的狀態顯示為
組態錯誤。管理員記錄包含類似下列內容的訊息:
nsx-manager NSX - FABRIC [nsx@6876 comp="nsx-manager" errorCode="MP16027" subcomp="manager"] Edge 758ad396-0754-11e8-877e-005056abf715 is not ready for configuration error occurred, error detail is NSX Edge configuration has failed. The host does not support required cpu features: ['aes'].
重新啟動 Edge 資料路徑服務,虛擬機器應會解決此問題。
強制移除傳輸節點
您可以藉由下列 API 呼叫,移除停滯在孤立狀態的傳輸節點:
DELETE https://<NSX Manager>/api/v1/transport-nodes/<TN ID>?force=true
NSX Manager 不會執行任何驗證,來確認是否有任何作用中的虛擬機器正在主機上執行。您要負責刪除 N-VDS 和 VIB。如果您已透過計算管理程式新增節點,請先刪除計算管理程式,然後刪除節點。傳輸節點也會一併刪除。