このセクションでは、インストールの問題のトラブルシューティングに関する情報を提供します。

基本的なインフラストラクチャ サービス

次のサービスがアプライアンスとハイパーバイザーで実行されている必要があります。また、vCenter Server をコンピュート マネージャとして使用している場合は、vCenter Server でも実行されている必要があります。
  • NTP
  • DNS

ファイアウォールが NSX-T Data Center コンポーネントとハイパーバイザーの間のトラフィックをブロックしていないことを確認します。コンポーネント間で必要なポートが開いていることを確認します。

NSX Manager の DNS キャッシュをフラッシュするには、SSH で root として NSX Manager にログインして次のコマンドを実行します。
root@nsx-mgr-01:~# /etc/init.d/resolvconf restart
[ ok ] Restarting resolvconf (via systemctl): resolvconf.service.
次に DNS 構成ファイルを確認できます。
root@nsx-mgr-01:~# cat /etc/resolv.conf
# Dynamic resolv.conf(5) file for glibc resolver(3) generated by resolvconf(8)
#     DO NOT EDIT THIS FILE BY HAND -- YOUR CHANGES WILL BE OVERWRITTEN
nameserver 192.168.253.1
search mgt.sg.lab

root ユーザーとしてログインして su admin を実行し、NSX Manager で nsxcli を起動します。admin ユーザーのデフォルト プロンプトは nsxcli です。

次の nsxcli コマンドを使用して DNS サーバを確認します。

get name-servers
198.10.10.1
198.10.10.2
198.10.10.3

ホストからコントローラおよびマネージャへの通信の確認

ESXi ホストでの NSX-T Data Center CLI コマンドの使用例:
esxi-01.corp.local> get managers
- 192.168.110.19   Connected
 
esxi-01.corp.local> get controllers
 Controller IP    Port     SSL         Status       Is Physical Master   Session State  Controller FQDN
 192.168.110.16   1235   enabled     connected             true               up               NA
KVM ホストでの NSX-T Data Center CLI コマンドの使用例:
kvm-01> get managers
- 192.168.110.19   Connected
 
kvm-01> get controllers
 Controller IP    Port     SSL         Status       Is Physical Master   Session State  Controller FQDN
 192.168.110.16   1235   enabled     connected             true               up               NA
ESXi ホストでのホスト CLI コマンドの使用例:
[root@esxi-01:~] esxcli network ip  connection list | grep 1235
tcp         0       0  192.168.110.53:42271                        192.168.110.16:1235   ESTABLISHED     67702  newreno  nsx-proxy
[root@esxi-01:~]
[root@esxi-01:~] esxcli network ip  connection list | grep 5671
tcp         0       0  192.168.110.253:11721             192.168.110.19:5671   ESTABLISHED   2103688  newreno  mpa
tcp         0       0  192.168.110.253:30977             192.168.110.19:5671   ESTABLISHED   2103688  newreno  mpa
KVM ホストでのホスト CLI コマンドの使用例:
root@kvm-01:/home/vmware# netstat -nap | grep 1235
tcp        0      0 192.168.110.55:53686    192.168.110.16:1235     ESTABLISHED 2554/nsx-proxy
root@kvm-01:/home/vmware#
root@kvm-01:/home/vmware#
root@kvm-01:/home/vmware# netstat -nap | grep 5671
tcp        0      0 192.168.110.55:50108    192.168.110.19:5671     ESTABLISHED 2870/mpa
tcp        0      0 192.168.110.55:50110    192.168.110.19:5671     ESTABLISHED 2870/mpa

root@kvm-01:/home/vmware# tcpdump -i ens32 port 1235 | grep kvm-01
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes
<truncated output>
03:46:27.040461 IP nsxcontroller01.corp.local.1235 > kvm-01.corp.local.38754: Flags [P.], seq 3315301231:3315301275, ack 2671171555, win 323, length 44
03:46:27.040509 IP kvm-01.corp.local.38754 > nsxcontroller01.corp.local.1235: Flags [.], ack 44, win 1002, length 0
^C
<truncated output>
root@kvm-01:/home/vmware#

root@kvm-01:/home/vmware# tcpdump -i ens32 port 5671 | grep kvm-01
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes
03:51:16.802934 IP kvm-01.corp.local.58954 > nsxmgr01.corp.local.amqps: Flags [P.], seq 1153:1222, ack 1790, win 259, length 69
03:51:16.823328 IP nsxmgr01.corp.local.amqps > kvm-01.corp.local.58954: Flags [P.], seq 1790:1891, ack 1222, win 254, length 101
^C
<truncated output>

ホストの登録の失敗

NSX-T Data Center で誤った IP アドレスを使用すると、ホストの登録に失敗します。この問題は、ホストに複数の IP アドレスが割り当てられている場合に発生する可能性があります。トランスポート ノードを削除しようとすると、そのノードは実体のない状態で残ります。問題の解決方法:
  • NSX-T Data Center ユーザー インターフェイスでホストを編集し、管理用を除くすべての IP アドレスを削除します。
  • エラーをクリックし、[解決] を選択します。

KVM ホストの問題

KVM ホストの問題は、ディスク容量の不足によって発生することがあります。 /boot ディレクトリが短時間で容量不足になり、次のようなエラーが発生する可能性があります。
  • ホストでのソフトウェアのインストールに失敗しました
  • デバイスに容量が残っていません
コマンド [df-h] を実行すると、使用可能なストレージを確認できます。 /boot ディレクトリが 100% である場合は、次の操作を行うことができます。
  • sudo dpkg --list 'linux-image*' | grep ^ii を実行して、インストールされているすべてのカーネルを確認します。
  • uname -r を実行して、現在実行中のカーネルを確認します。このカーネル(linux イメージ)を削除しないでください。
  • 不要となったイメージは、apt-get purge を使用して削除します。たとえば、sudo apt-get purge linux-image-3.13.0-32-generic linux-image-3.13.0-33-generic を実行します。
  • ホストを再起動します。
  • NSX Manager でエラーをチェックし、[解決] を選択します。
  • 仮想マシンがパワーオン状態であることを確認します。

Edge 仮想マシン展開時の構成エラー

Edge 仮想マシンの展開後、NSX Manager に仮想マシンの状態として [構成エラー] が表示されます。NSX Manager のログには、次の内容のメッセージが記録されています。
nsx-manager NSX - FABRIC [nsx@6876 comp="nsx-manager" errorCode="MP16027" subcomp="manager"] Edge 758ad396-0754-11e8-877e-005056abf715 is not ready for configuration error occurred, error detail is NSX Edge configuration has failed. The host does not support required cpu features: ['aes'].

Edge データパス サービスを再起動すると、仮想マシンによってこの問題が解決されます。

トランスポート ノードの強制的な削除

次の API 呼び出しを実行して、実体のない状態で停止しているトランスポート ノードを削除できます。
DELETE https://<NSX Manager>/api/v1/transport-nodes/<TN ID>?force=true

NSX Manager では、ホスト上でアクティブな仮想マシンが実行されているかどうかは検証されません。N-VDS および VIB を削除するのは、管理者の責任です。コンピュート マネージャを使用して追加したノードがある場合は、最初にコンピュート マネージャを削除し、次にノードを削除します。トランスポート ノードも一緒に削除されます。