En este capítulo se incluyen los escenarios de errores típicos que pueden afectar a los componentes del subsistema de enrutamiento de NSX y se describen los efectos de estos errores.

NSX Manager

Tabla 1. Efectos y modos de errores de NSX Manager

Modo de error

Efectos de errores

Pérdida de conectividad de red a la máquina virtual NSX Manager

  • Interrupción total de todas las funciones de NSX Manager, incluidas las operaciones CRUD para el enrutamiento o el puente de NSX

  • No se pierden datos de configuración

  • No se pierden el plano de control ni los datos

Pérdida de la conectividad de red entre NSX Manager y los hosts ESXi o error en el servidor RabbitMQ

  • Si la máquina virtual de control de DLR o la ESG se ejecutan en los hosts afectados, se produce un error en las operaciones CRUD en ellos

  • Se produce un error al crear o eliminar instancias de DLR en hosts afectados

  • No se pierden datos de configuración

  • No se pierden el plano de control ni los datos

  • Las actualizaciones del enrutamiento dinámico siguen funcionando

Pérdida de conectividad de red entre NSX Manager y las controladoras

  • Se produce un error en las operaciones de creación, actualización y eliminación en el puente y el enrutamiento distribuido de NSX

  • No se pierden datos de configuración

  • No se pierden el plano de control ni los datos

La máquina virtual de NSX Manager se destruye (error en el almacén de datos)

  • Interrupción total de todas las funciones de NSX Manager, incluidas las operaciones CRUD para el enrutamiento o el puente de NSX

  • Riesgo de que un subconjunto de instancias de enrutamiento o puente se convierta en huérfano si NSX Manager se restaura a una configuración anterior. Se solicitará una limpieza manual y una reconciliación

  • No se pierden datos ni el plano de control a menos que se requiere una reconciliación

Clúster de la controladora

Tabla 2. Efectos y modos de errores de NSX Controller

Modo de error

Efectos de errores

El clúster de la controladora pierde conectividad de red con los hosts ESXi

  • Pérdida total de las funciones del plano de control de DLR (creación, actualización y eliminación de rutas, incluidas las dinámicas)

  • Pérdida de las funciones del plano de administración de DLR (creación, actualización y eliminación de los LIF en los hosts)

  • El reenvío de VXLAN se ve afectado, lo que puede provocar también un error en el proceso completo de reenvío (Capa 2 + Capa 3)

  • El plano de datos sigue funcionando según el último estado conocido

Una o dos controladoras pierden conectividad con los hosts ESXi

  • Si una controladora afectada puede seguir llegando a otras controladoras del clúster, las instancias del DLR que utiliza esta controladora experimentan los mismos efectos que los descritos anteriormente. Otras controladoras no se reemplazan automáticamente

Una controladora pierde la conectividad de red con otras controladoras (o la pierde por completo)

  • Dos controladoras restantes reemplazan a las VXLAN y los DLR que utiliza la controladora aislada

  • La controladora afectada pasa a modo de solo lectura, coloca sus sesiones en los hosts y rechaza las nuevas

Las controladoras pierden la conectividad entre ellas

  • Todas las controladoras pasarán al modo de solo lectura, cerrarán la conexión a los hosts y rechazarán las nuevas

  • Se produce un error en las operaciones de creación, actualización y eliminación en las rutas (incluidas las dinámicas) y los LIF de todos los DLR

  • La configuración del enrutamiento de NSX (LIFs) puede perder la sincronización entre NSX Manager y el clúster de la controladora, lo que permite solicitar que se intervenga de forma manual para volver a realizar la sincronización

  • Los hosts seguirán funcionando en el último estado conocido del plano de control

Se pierde una máquina virtual de la controladora

  • El clúster de la controladora pierde redundancia

  • El plano de control o de administración sigue funcionando con normalidad

Se pierden dos máquinas virtuales de la controladora

  • La controladora restante pasará al modo de solo lectura. El efecto es el mismo que el que se produce cuando las controladoras pierden conectividad entre ellas (como se indica anteriormente). Es posible que se requiera recuperar el clúster manualmente

Módulos del host

netcpa se basa en el certificado y la clave SSL del host, así como en huellas digitales SSL para establecer comunicaciones seguras con las controladoras. Se obtienen de NSX Manager a través del bus de mensajería que proporciona vsfwd.

Si se produce un error en el proceso de intercambio de certificados, netcpa no podrá conectarse correctamente a las controladoras.

Nota: en esta sección no se incluyen los errores de los módulos kernel, ya que su efecto es grave (PSOD) y no suele producirse.

Tabla 3. Efectos y modos de errores del módulo del host

Modo de error

Efectos de errores

vsfwd utiliza la autenticación por contraseña o nombre de usuario para acceder al servidor del bus de mensajería, el cual puede caducar

  • Si un vsfwd de un host ESXi que se preparó recientemente no puede llegar a NSX Managar en dos horas, la contraseña o el inicio de sesión temporales que se proporcionaron durante la instalación caducan y el bus de mensajería de este host deja de funcionar

Los efectos de errores del cliente del bus de mensajería (vswfd) dependen del tiempo.

Si se produce un error antes de que otras partes del plano de control de NSX puedan llegar al estado en ejecución estable

  • El enrutamiento dinámico de los hosts deja de funcionar porque el host no puede comunicarse con las controladoras

  • El host no conoce las instancias de DLR de NSX Manager

Si se produce un error después de que el host llegue al estado estable

  • Las ESG y las máquinas virtuales de control de DLR que se ejecutan en el host no podrán recibir las actualizaciones de configuración

  • El host no conoce los DLR nuevos y no puede eliminar los DLR existentes

  • La ruta de datos del host seguirá funcionando según la configuración que el host tenía cuando se produjo el error

Tabla 4. Efectos y modos de errores de netcpa

Modo de error

Efectos de errores

Los efectos de errores del agente del plano de control (netcpa) dependen del tiempo

Si se produce un error antes de que los módulos kernel de la ruta de datos de NSX puedan llegar al estado en ejecución estable

  • El enrutamiento distribuido del host deja de funcionar

Si se produce un error después de que el host llegue al estado estable

  • Las máquinas virtuales de control de DLR que se ejecutan en el host no pondrán enviar sus actualizaciones de la tabla de reenvío a las controladoras

  • La ruta de datos del enrutamiento distribuido no recibirá las actualizaciones de rutas ni los LIF de las controladoras, pero seguirá funcionando según el estado que tuviera antes de producirse el error

Máquina virtual de control de DLR

Tabla 5. Efectos y modos de error de la máquina virtual de control de DLR

Modo de error

Efectos de errores

La máquina virtual de control de DLR se perdió o se apagó

  • Se produce un error en las operaciones de creación, actualización y eliminación en las rutas y los LIF de este DLR

  • Las actualizaciones de la ruta dinámica no se enviarán a los hosts (incluida la retirada de prefijos que se reciben a través de las adyacencias que ya no funcionan)

La máquina virtual de control de DLR pierde conectividad con NSX Manager y las controladoras

  • Los mismos efectos que se describieron anteriormente, excepto si la máquina virtual de control de DLR y sus adyacencias de enrutamiento siguen estando activas. El tráfico de y hacia los prefijos conocidos no se verá afectado

La máquina virtual de control de DLR pierde conexión con NSX Manager

  • Se produce un error en las operaciones de creación, actualización y eliminación de NSX Manager en las rutas y los LIF de este DLR y no se vuelve a intentar realizar estas operaciones

  • Las actualizaciones del enrutamiento dinámico siguen propagándose

La máquina virtual de control de DLR pierde conexión con las controladoras

  • Los cambios de enrutamiento (estático o dinámico) de este DLR no se propagan a los hosts