Cette section fournit des informations sur le dépannage des problèmes d'installation.

Services d'Infrastructure de base

Les services suivants doivent s'exécuter sur les dispositifs et les hyperviseurs, également sur vCenter Server si ce dernier est utilisé comme gestionnaire de calcul.
  • NTP
  • DNS

Assurez-vous que le pare-feu ne bloque pas le trafic entre les composants NSX-T et les hyperviseurs. Assurez-vous que les ports requis sont ouverts entre les composants.

Pour vider le cache DNS sur NSX Manager, utilisez SSH pour vous connecter en tant qu'utilisateur racine au gestionnaire et exécutez la commande suivante :
root@nsx-mgr-01:~# /etc/init.d/resolvconf restart
[ ok ] Restarting resolvconf (via systemctl): resolvconf.service.
Vous pouvez ensuite vérifier le fichier de configuration DNS.
root@nsx-mgr-01:~# cat /etc/resolv.conf
# Dynamic resolv.conf(5) file for glibc resolver(3) generated by resolvconf(8)
#     DO NOT EDIT THIS FILE BY HAND -- YOUR CHANGES WILL BE OVERWRITTEN
nameserver 192.168.253.1
search mgt.sg.lab

Vérification de la communication d'un hôte à un contrôleur et à un gestionnaire

Sur un hôte ESXi à l'aide des commandes d'interface de ligne de commande NSX-T :
esxi-01.corp.local> get managers
- 192.168.110.19   Connected
 
esxi-01.corp.local> get controllers
 Controller IP    Port     SSL         Status       Is Physical Master   Session State  Controller FQDN
 192.168.110.16   1235   enabled     connected             true               up               NA
Sur un hôte KVM à l'aide des commandes d'interface de ligne de commande NSX-T :
kvm-01> get managers
- 192.168.110.19   Connected
 
kvm-01> get controllers
 Controller IP    Port     SSL         Status       Is Physical Master   Session State  Controller FQDN
 192.168.110.16   1235   enabled     connected             true               up               NA
Sur un hôte ESXi à l'aide des commandes d'interface de ligne de commande d'hôte :
[root@esxi-01:~] esxcli network ip  connection list | grep 1235
tcp         0       0  192.168.110.53:42271                        192.168.110.16:1235   ESTABLISHED     67702  newreno  netcpa
[root@esxi-01:~]
[root@esxi-01:~] esxcli network ip  connection list | grep 5671
tcp         0       0  192.168.110.253:11721             192.168.110.19:5671   ESTABLISHED   2103688  newreno  mpa
tcp         0       0  192.168.110.253:30977             192.168.110.19:5671   ESTABLISHED   2103688  newreno  mpa
Sur un hôte KVM à l'aide des commandes d'interface de ligne de commande d'hôte :
root@kvm-01:/home/vmware# netstat -nap | grep 1235
tcp        0      0 192.168.110.55:53686    192.168.110.16:1235     ESTABLISHED 2554/netcpa
root@kvm-01:/home/vmware#
root@kvm-01:/home/vmware#
root@kvm-01:/home/vmware# netstat -nap | grep 5671
tcp        0      0 192.168.110.55:50108    192.168.110.19:5671     ESTABLISHED 2870/mpa
tcp        0      0 192.168.110.55:50110    192.168.110.19:5671     ESTABLISHED 2870/mpa

root@kvm-01:/home/vmware# tcpdump -i ens32 port 1235 | grep kvm-01
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes
<truncated output>
03:46:27.040461 IP nsxcontroller01.corp.local.1235 > kvm-01.corp.local.38754: Flags [P.], seq 3315301231:3315301275, ack 2671171555, win 323, length 44
03:46:27.040509 IP kvm-01.corp.local.38754 > nsxcontroller01.corp.local.1235: Flags [.], ack 44, win 1002, length 0
^C
<truncated output>
root@kvm-01:/home/vmware#

root@kvm-01:/home/vmware# tcpdump -i ens32 port 5671 | grep kvm-01
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on ens32, link-type EN10MB (Ethernet), capture size 262144 bytes
03:51:16.802934 IP kvm-01.corp.local.58954 > nsxmgr01.corp.local.amqps: Flags [P.], seq 1153:1222, ack 1790, win 259, length 69
03:51:16.823328 IP nsxmgr01.corp.local.amqps > kvm-01.corp.local.58954: Flags [P.], seq 1790:1891, ack 1222, win 254, length 101
^C
<truncated output>

Échec d'enregistrement de l'hôte

Si NSX-T utilise l'adresse IP incorrecte, l'enregistrement de l'hôte échoue. Cela peut se produire lorsqu'un hôte possède plusieurs adresses IP. Une tentative de suppression du nœud de transport laisse ce dernier à l'état Orphelin. Pour résoudre le problème :
  • Accédez à Infrastructure > Nœuds > Hôtes, modifiez l'hôte et supprimez toutes les adresses IP à l'exception de celle de gestion.
  • Cliquez sur les erreurs et sélectionnez Résoudre.

Problèmes de l'hôte KVM

Les problèmes de l'hôte KVM sont parfois induits par une insuffisance d'espace disque. Le répertoire /boot peut se remplir rapidement et provoquer des erreurs comme :
  • Échec de l'installation du logiciel sur l'hôte
  • Aucun espace restant sur le périphérique
Vous pouvez exécuter la commande df-h pour vérifier l'espace de stockage disponible. Si le répertoire /boot est à 100 %, vous pouvez procédez comme suit :
  • Exécutez sudo dpkg --list 'linux-image*' | grep ^ii pour voir tous les noyaux installés.
  • Exécutez uname -r pour voir le noyau en cours d'exécution. Ne supprimez pas ce noyau (linux-image).
  • Utilisez apt-get purge pour supprimer les images dont vous n'avez plus besoin. Par exemple, exécutez sudo apt-get purge linux-image-3.13.0-32-generic linux-image-3.13.0-33-generic.
  • Redémarrez l'hôte.
  • Dans NSX Manager, vérifiez les erreurs et sélectionnez Résoudre.
  • Assurez-vous que les machines virtuelles sont sous tension.

Erreur de configuration lors du déploiement d'une machine virtuelle Edge

Après le déploiement d'une machine virtuelle Edge, NSX Manager affiche l'état de la machine virtuelle sous la forme d'une erreur de configuration. Le journal du gestionnaire dispose d'un message similaire au suivant :
nsx-manager NSX - FABRIC [nsx@6876 comp="nsx-manager" errorCode="MP16027" subcomp="manager"] Edge 758ad396-0754-11e8-877e-005056abf715 is not ready for configuration error occurred, error detail is NSX Edge configuration has failed. The host does not support required cpu features: ['aes'].

Redémarrer le service de chemin de données du dispositif Edge, puis la machine virtuelle doit résoudre le problème.

Forcer la suppression d'un nœud de transport

Vous pouvez supprimer un nœud de transport bloqué à l'état Orphelin en effectuant l'appel API suivant :
DELETE https://<NSX Manager>/api/v1/transport-nodes/<TN ID>?force=true

NSX Manager ne procède à aucune validation quant à l'exécution éventuelle de machines virtuelles actives sur l'hôte. Vous êtes responsable de la suppression de N-VDS et des fichiers VIB. Si vous avez ajouté le nœud via le gestionnaire de calcul, supprimez d'abord le gestionnaire de calcul, puis supprimez le nœud. Le nœud de transport est également supprimé.