Problema

La conectividad de MPA de NSX Edge está inactiva debido al bloqueo del servicio de infraestructura.

Causa

Los discos del nodo de NSX Edge llenos o una pérdida de memoria pueden provocar que ciertos procesos se bloqueen y provoquen este error. Es posible que la CLI admin get managers devuelva el nodo de administrador activo (si se produjo un bloqueo después de registrar correctamente el administrador) y la CLI admin get controller generará un error de obtención de lista de controladores.

Solución

  1. Ejecute la CLI admin get diagnosis config o GET API /api/v1/transport-nodes/{transport-node-id}/node/diagnosis para diagnosticar errores relacionados con el estado de los nodos de NSX Edge que se producen cuando los servicios se desactivan.
  2. Ejecute la CLI admin get cores-dumps para ver si se generó algún núcleo (en /var/core o /image/core) debido al bloqueo del servicio. Si observa un volcado de núcleo, ejecute el comando top -o %MEM como root para ver qué proceso de NSX está consumiendo demasiada memoria y la CLI admin get filesystem-status para comprobar si las particiones de disco utilizadas por NSX no están llenas ni casi llenas.
  3. Ejecute la CLI root /etc/init.d/nsx-proxy | nsx-nestdb status para obtener el estado de los servicios de infraestructura en el nodo de NSX Edge.
  4. Limpie el espacio de disco y, a continuación, inicie los servicios de infraestructura detenidos en el host ejecutando el comando /etc/init.d/<service-name> start (como solución alternativa temporal). Abra una incidencia de soporte con VMware si ve algún núcleo.