Escenario 3: conmutación por recuperación completa del sitio principal

En este escenario, el sitio 1 principal se desactiva por un mantenimiento programado, o bien por un fallo de alimentación imprevisto. Todas las cargas de trabajo se ejecutan en el sitio 2 secundario (que pasa a ser el sitio principal) y el tráfico se enruta a través del UDLR y las instancias de NSX Edge del sitio 2. Ahora, el sitio 1 principal original vuelve a estar activo y el administrador de NSX quiere recuperar componentes de NSX y restaurar todas las cargas de trabajo en el sitio 1 principal original.

El administrador de NSX quiere cumplir los siguientes objetivos principales:

Conseguir una conmutación por recuperación completa de todas las cargas de trabajo del sitio 2 al sitio 1 principal original con el menor periodo de inactividad.
Conservar las direcciones de IP de aplicaciones después de la conmutación por recuperación al sitio 1.
Recuperar automáticamente toda la configuración de la interfaz de Edge y del protocolo BGP en el sitio 1.

Nota:

El administrador puede realizar las tareas de conmutación por recuperación manualmente mediante vSphere Web Client, o bien al ejecutar las REST API de NSX. Asimismo, el administrador puede automatizar algunas tareas de conmutación por recuperación mediante la ejecución de un archivo de script que contenga las API que se deben usar durante la conmutación por recuperación. En este escenario, se explican los pasos para la conmutación por recuperación manual con vSphere Web Client. Sin embargo, si algún paso requiere utilizar la CLI o las REST API de NSX, le facilitamos las instrucciones correspondientes.
En este escenario, el flujo de trabajo de la recuperación ante desastres es específico de la topología explicada anteriormente, que cuenta con una instancia de NSX Manager principal y una única instancia de NSX Manager secundaria. Este escenario no prevé la utilización de un flujo de trabajo con varias instancias de NSX Manager secundarias.

Requisitos previos

En los sitios 1 y 2, está instalado NSX Data Center 6.4.5 o versiones posteriores.
vCenter Server está instalado en los sitios 1 y 2 en el Modo vinculado mejorado (Enhanced Linked Mode).
En los sitios 1 y 2, se cumplen las siguientes condiciones:
- No hay configuradas directivas de seguridad específicas de aplicaciones en un firewall que no sea de NSX, en caso de que se utilice alguno.
- No hay configuradas reglas de firewall específicas de aplicaciones en un firewall que no sea de NSX, en caso de que se utilice alguno.
- El firewall está deshabilitado en las dos ESG porque el protocolo de enrutamiento ECMP está habilitado en los UDLR y, de esta forma, se asegura de que se permita todo el tráfico.

En el sitio 2 (que pasa a ser principal), los componentes lógicos universales no sufren modificaciones antes de iniciar el proceso de conmutación por recuperación.

Procedimiento

Cuando el sitio 1 principal vuelva a estar activo, asegúrese de que la instancia de NSX Manager y los nodos del clúster del controlador estén activados y en ejecución.
1. Acceda a Redes y seguridad (Networking & Security) > Panel de control (Dashboard) > Descripción general (Overview).
2. En el menú desplegable, seleccione la instancia de NSX Manager principal.
3. En el panel Descripción general del sistema (System Overview), compruebe el estado de la instancia de NSX Manager y de los nodos del clúster del controlador.
  Si aparece un punto verde opaco junto a NSX Manager y a los nodos del controlador significa que ambos componentes de NSX están activados y en ejecución.
Antes de iniciar el proceso de conmutación por recuperación, realice las siguientes comprobaciones:
1. En la página Instalación y actualización (Installation and Upgrade), desplácese hasta Administración (Management) > Instancias de NSX Manager (NSX Managers). Compruebe que las instancias de NSX Manager de los dos sitios tengan una función principal.
2. En la página Nodos de NSX Controller (NSX Controller Nodes), asegúrese de que haya nodos de clúster de controladores universal (Universal Controller Cluster, UCC) en los dos sitios.
Apague los tres nodos de UCC asociados al sitio 2 (que pasó a ser principal).
En la página Nodos de NSX Controller (NSX Controller Nodes), elimine los tres nodos de UCC asociados al sitio 2 (que pasó a ser principal).

Sugerencia: Puede usar las REST API de NSX para eliminar un nodo del controlador a la vez mediante la ejecución de la siguiente llamada de API: https://NSX_Manager_IP/api/2.0/vdn/controller/{controllerID}. No obstante, fuerce la eliminación del último nodo del controlador mediante la ejecución de la siguiente llamada de API: https://NSX_Manager_IP/api/2.0/vdn/controller/{controllerID}?forceRemoval=true.
Asegúrese de que los componentes universales del sitio 2 (que pasó a ser principal) no se modifiquen antes de continuar con el siguiente paso.
Elimine la función principal de la instancia de NSX Manager en el sitio 2 (que pasó a ser principal).
1. En la página Instalación y actualización (Installation and Upgrade), desplácese a Gestión (Management) > Instancias de NSX Manager (NSX Managers).
2. Seleccione la instancia de NSX Manager en el sitio 2 y haga clic en Acciones (Actions) > Eliminar función principal (Remove Primary Role).
  Aparecerá un mensaje para garantizar que los controladores propiedad de la instancia de NSX Manager del sitio 2 se eliminen antes de quitar la función principal.
3. Haga clic en Sí (Yes).
  La instancia NSX Manager del sitio 2 pasa a tener la función Tránsito (Transit).
En la instancia principal de NSX Manager del sitio 1, elimine la instancia de NSX Manager asociada.
1. En la página Instancias de NSX Manager (NSX Managers), seleccione la instancia de NSX Manager asociada al sitio 1.
2. Haga clic en Acciones (Actions) > Eliminar NSX Manager secundario (Remove Secondary Manager).
3. Seleccione la casilla de verificación Realizar operación aunque NSX Manager sea inaccesible (Perform operation even if NSX Manager is inaccessible).
4. Haga clic en Eliminar (Remove).
Registre la instancia de NSX Manager en el sitio 2, que está en tránsito, como la secundaria de la instancia principal de NSX Manager en el sitio 1.

Precaución: Como la salida local está deshabilitada en la máquina virtual de control del UDLR (máquina virtual del dispositivo de Edge), la máquina virtual de control se elimina automáticamente. Por lo tanto, antes de registrar la instancia de NSX Manager en el sitio 2 (actualmente con la función Tránsito [Transit]) con una función secundaria, asegúrese de que se eliminen los nodos del clúster del controlador del sitio 2. Si no se eliminan, el tráfico de red puede sufrir interrupciones.
1. En la página Instalación y actualización (Installation and Upgrade), desplácese a Gestión (Management) > Instancias de NSX Manager (NSX Managers).
2. Seleccione la instancia de NSX Manager asociada al sitio 1.
3. Haga clic en Acciones (Actions) > Agregar instancia de NSX Manager secundaria (Add Secondary Manager).
4. Seleccione la instancia de NSX Manager asociada al sitio 2.
5. Introduzca el nombre de usuario y la contraseña de la instancia de NSX Manager en el sitio 2 y acepte el certificado de seguridad.
6. Haga clic en Agregar (Add).
Después de completar todos estos pasos secundarios, compruebe que obtiene los siguientes resultados:
- La instancia de NSX Manager del sitio 1 tiene una función principal, mientras que la instancia de NSX Manager del sitio 2 tiene una función secundaria.
- En la instancia de NSX Manager del sitio 2, hay tres nodos del controlador sombra con estado Desconectado (Disconnected). Aparece el siguiente mensaje: Se pueden leer o actualizar las propiedades del clúster del controlador solo en la instancia de NSX Manager principal o independiente (Can read or update controller cluster properties only on Primary or Standalone Manager).
  Este mensaje significa que la instancia de NSX Manager secundaria del sitio 2 no puede establecer la conectividad con los nodos del clúster de controlador universal de la instancia principal de NSX Manager del sitio 1. Sin embargo, transcurridos unos segundos, la conexión se vuelve a restablecer y el estado cambia a Conectado (Connected).
Encienda la máquina virtual de control (máquina virtual del dispositivo de Edge) en el UDLR y las instancias de NSX Edge en el sitio 1.
1. Desplácese hasta Redes (Networking) > Máquinas virtuales (VMs) > Máquinas virtuales (Virtual Machines).
2. Haga clic con el botón secundario en el nombre de la máquina virtual (identificador de la máquina virtual) y haga clic en Encender (Power on).
3. Repita el paso b) para las máquinas virtuales de Edge que quiera encender.
4. Espere a que la máquina virtual de control del UDLR y las máquinas virtuales de Edge estén activadas y en ejecución antes de continuar con el siguiente paso.
Asegúrese de que la máquina virtual de control del UDLR (máquina virtual del dispositivo de Edge) asociada a la instancia secundaria de NSX Manager del sitio 2 se eliminen automáticamente.
1. Desplácese hasta Redes y seguridad (Networking & Security) > NSX Edge.
2. Seleccione la instancia secundaria de NSX Manager y, a continuación, haga clic en un UDLR.
3. En la página Estado (Status), compruebe que no haya ninguna máquina virtual del dispositivo Edge implementada en el UDLR.
Actualice el estado de la instancia de NSX Controller en el sitio 1 principal para que los servicios del controlador se sincronicen con el sitio 2 secundario.
1. En la página Instalación y actualización (Installation and Upgrade), haga clic en Instancias de NSX Manager (NSX Managers).
2. Seleccione la instancia principal de NSX Manager del sitio 1.
3. Haga clic en Acciones (Actions) > Actualizar estado del controlador (Update Controller State).
Migre las máquinas virtuales de carga de trabajo del sitio 2 al sitio 1.

Nota: Dado que las máquinas virtuales de carga de trabajo seguirán manteniéndose en el sitio 2, deberá migrar manualmente estas máquinas al sitio 1.

Resultados

De esta forma concluye la conmutación por recuperación manual de todos los componentes y todas las cargas de trabajo de NSX del sitio secundario (sitio 2) al sitio principal (sitio 1).

Qué hacer a continuación

Compruebe que la conmutación por recuperación al sitio 1 principal ha finalizado por completo. Para ello, siga estos pasos en el sitio 1:

Compruebe que NSX Manager tenga la función principal.
Compruebe que la máquina virtual de control (máquina virtual del dispositivo de Edge) esté implementada en el UDLR.
Compruebe que el estado de todos los nodos del clúster del controlador sea Conectado (Connected).
Realice una comprobación de estado de comunicación en cada clúster del host que esté preparado para NSX.
1. Acceda a Instalación y actualización (Installation and Upgrade) > Preparación del host (Host Preparation).
2. Seleccione la instancia de NSX Manager del sitio 1.
3. Seleccione un clúster a la vez y compruebe que el estado del canal de comunicación del clúster sea ACTIVO (UP).
4. Para cada host del clúster, compruebe que el estado del canal de comunicación del host sea ACTIVO (UP).
5. Compruebe que el estado de preparación del host sea Verde (Green).
Inicie sesión en la consola de la CLI de cada máquina virtual de control del UDLR (máquina virtual del dispositivo de Edge) y realice estos pasos:
1. Compruebe que todos los vecinos BGP estén establecidos y activados. Para ello, ejecute el comando show ip bgp neighbors .
2. Compruebe que todos los vecinos BGP conozcan las rutas de BGP mediante el comando show ip route bgp.

Después de completar la conmutación por recuperación al sitio 1, todas las cargas de trabajo se ejecutarán en el sitio 1 principal y el tráfico se enrutará a través del UDLR y las instancias de NSX Edge del sitio 1.