La función de recuperación ante desastres de SASE Orchestrator (DR) evita la pérdida de datos almacenados y reanuda los servicios de SASE Orchestrator en caso de que se produzca un error en el sistema o en la red.

La recuperación ante desastres de SASE Orchestrator implica configurar un par de instancias de SASE Orchestrator activo/en espera con replicación de datos y un mecanismo de conmutación por error activado manualmente.
  • Por lo tanto, el objetivo de tiempo de recuperación depende de la acción explícita del operador para activar la promoción del modo de espera.
  • El objetivo de punto de recuperación, sin embargo, es esencialmente cero, independientemente del tiempo de recuperación, ya que toda la configuración se replica de forma instantánea. La supervisión de los datos que se recopilaron durante la interrupción se almacena en caché en las instancias de Edge y Gateway pendientes de promoción del modo de espera.
Nota: La recuperación ante desastres es obligatoria. Para obtener asistencia en relación con licencias y precios, póngase en contacto con el equipo de ventas de VMware.

Par en modo Activo Espera

En una implementación de recuperación ante desastres de SASE Orchestrator, dos sistemas SASE Orchestrator idénticos se configuran como un par en modo Activo Espera. El operador puede ver el estado de preparación de la recuperación ante desastres a través de la interfaz de usuario web de cualquiera de los servidores. Las instancias de Edge y las puertas de enlace detectan las dos instancias de SASE Orchestrator y, mientras reciben los cambios de configuración solo desde la instancia de SASE Orchestrator activo, envían periódicamente latidos de recuperación ante desastres a ambos sistemas para notificar su visibilidad de ambos servidores y para consultar el estado del sistema de recuperación ante desastres. Cuando el operador activa una conmutación por error, las instancias de Edge y Gateway son informadas acerca del cambio en su siguiente latido de recuperación ante desastres.

Estados de recuperación ante desastres

Desde la vista de un operador, y de las instancias de Edge y Gateway, SASE Orchestrator tiene uno de los cuatro posibles estados de recuperación ante desastres siguientes:

Estado de recuperación ante desastres Descripción
Independiente (Standalone) Ninguna DR configurada.
Activa Recuperación ante desastres configurada, actuando como el servidor de SASE Orchestrator principal.
En espera Recuperación ante desastres configurada, actuando como un servidor de SASE Orchestrator de réplica inactiva.
Inerte (Zombie) Recuperación ante desastres anteriormente configurada y activa, pero actualmente sin funcionamiento como activa o en espera.

Operación en tiempo de ejecución

Cuando se configura la recuperación ante desastres, el servidor en espera se ejecuta en modo limitado y bloquea todas las llamadas de API, excepto aquellas relacionadas con el estado de recuperación ante desastres y los latidos de recuperación ante desastres. Cuando el operador invoca una conmutación por error, el modo de espera se promociona para que sea completamente operativo como servidor independiente. El servidor que anteriormente estaba activo se pasa automáticamente a un estado denominado "inerte" si responde y es visible desde el modo de espera promocionado. En el estado inerte, los servicios de configuración de administración se bloquean y cualquier contacto de las instancias de Edge y las puertas de enlace que no se transfieren a las nuevas instancias de SASE Orchestrator activo se redireccionan al servidor promocionado.

disaster-recovery-replica-and-status

Configurar la replicación de SASE Orchestrator

Se requieren dos instancias de SASE Orchestrator instaladas para iniciar la replicación.

  • El modo de espera seleccionado se coloca en estado STANDBY_CANDIDATE, lo cual permite que lo configure el servidor activo.
  • A continuación, el servidor activo recibe la dirección y las credenciales de la instancia en espera, y entra en estado ACTIVE_CONFIGURING.
Cuando STANDBY_CONFIG_RQST pasa de activo a en espera, los dos servidores se sincronizan a través de las transiciones de estado.
Las dos instancias de Orchestrator en las que se debe establecer la recuperación ante desastres (DR) deben tener la misma hora. Antes de iniciar la replicación de SASE Orchestrator, asegúrese de comprobar las siguientes configuraciones de NTP:
  • La zona horaria de la puerta de enlace debe estar establecida en ETC/UTC. Use el siguiente comando para ver la zona horaria de NTP.
    vcadmin@vcg1-example:~$ cat /etc/timezone
    Etc/UTC
    vcadmin@vcg1-example:~$ 
    

    Si la zona horaria no es correcta, utilice los siguientes comandos para actualizar la zona horaria.

    echo "Etc/UTC" | sudo tee /etc/timezone
    sudo dpkg-reconfigure --frontend noninteractive tzdata
    
  • El desplazamiento de NTP debe ser inferior o igual a 15 milisegundos. Use el siguiente comando para ver el desplazamiento de NTP.
    sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p
         remote           refid      st t when poll reach   delay   offset  jitter
    ==============================================================================
    *ntp1-us1.prod.v 74.120.81.219    3 u  474 1024  377   10.171   -1.183   1.033
     ntp1-eu1-old.pr .INIT.          16 u    - 1024    0    0.000    0.000   0.000
    vcadmin@vcg1-example:~$ 
    

    Si el desplazamiento es incorrecto, utilice los siguientes comandos para actualizar el desplazamiento de NTP.

    sudo systemctl stop ntp
    sudo ntpdate <server>
    sudo systemctl start ntp
  • De forma predeterminada, se configura una lista de servidores NTP en el archivo /etc/ntpd.conf. Las instancias de Orchestrator en las que se debe establecer la recuperación ante desastres deben tener Internet para acceder a los servidores NTP predeterminados y garantizar que la hora esté sincronizada en ambas instancias de Orchestrator. Los clientes también pueden utilizar el servidor NTP local que se ejecuta en su entorno para sincronizar la hora.

Configurar la instancia de Orchestrator en espera

Para configurar la instancia en espera de Orchestrator, realice los siguientes pasos:

  1. En el servicio de SD-WAN del portal de empresas, haga clic en la pestaña Orchestrator y, en el panel izquierdo, haga clic en el botón Replicación (Replication) para abrir la pantalla Replicación de Orchestrator (Orchestrator Replication).
  2. Para activar la instancia de Orchestrator en espera, seleccione el botón de opción En espera (Standby) (función de replicación).
  3. Haga clic en el botón Habilitar para en espera (Enable for Standby).

    Al hacerlo, aparece la página Orchestrator en espera (Standby Orchestrator).

  4. Introduzca los parámetros de Configuración manual (Manual Configuration) y haga clic en el botón Actualizar información de configuración (Update configuration info).

    Después de configurar la instancia de Orchestrator en espera para la replicación, configure la instancia de Orchestrator activa de acuerdo con las instrucciones que aparecen a continuación.

Configurar la instancia de Orchestrator activa

Para configurar la instancia activa de Orchestrator, seleccione la Función de replicación (Replication Role) como Activa (Active) y configure lo siguiente:

Opción Descripción
Seleccionar función de replicación (Select Replication Role) Seleccione el botón de opción Activo (Active) de la función de replicación.
Dirección de Orchestrator en espera (Standby Orchestrator Address) Introduzca la dirección IP principal de la instancia de Orchestrator en espera.
Dirección de Orchestrator en espera (IPv6) (Standby Orchestrator Address [IPv6]) Introduzca la dirección IPv6 de la instancia de Orchestrator en espera.
Dirección secundaria de Orchestrator en espera (Standby Orchestrator Secondary Address) Introduzca la dirección de la interfaz secundaria de la instancia de Orchestrator en espera. Esta dirección se utiliza en la replicación si la instancia en espera pasa a ser la instancia activa. Los usuarios pueden agregar aquí una dirección Ipv4/Ipv6 o un FQDN.
UUID de Orchestrator en espera (Standby Orchestrator UUID) Introduzca el UUID de la instancia de Orchestrator en espera.
Modo de configuración (Configuration Mode) Seleccione los botones de opción Configurar el modo en espera automáticamente (Auto Configure Standby) o Configurar el modo de espera manualmente (Manually Configure Standby) según proceda.

Si se configura manualmente, pegue un valor de cadena del VCO activo en STANDBY_WAIT

.
Nombre del superusuario (Superuser Username) Introduzca el nombre para mostrar del superusuario de Orchestrator.
Contraseña de superusuario de Orchestrator en espera (Standby Orchestrator Superuser Password) Introduzca la contraseña del superusuario de Orchestrator.
  1. Haga clic en el botón Habilitar como activa (Enable for Active) para activar la función de replicación.

Cuando se complete la configuración, las dos instancias de Orchestrator (en espera y activo) están sincronizados.

Orchestrator en espera en sincronización

Orchestrator activo en sincronización

Probar la conmutación por error

Los siguientes escenarios de prueba de la conmutación por error representan situaciones forzadas para fines de ejemplo. Puede realizar estas acciones en el área Acciones disponibles (Available Actions) de las pantallas Activo (Active) y En espera (Standby).

Promocionar una instancia de Orchestrator en espera

En esta sección se describe cómo promocionar una instancia de Orchestrator en espera.

Haga lo siguiente para promocionar una instancia de Orchestrator en espera:

  1. Haga clic en el vínculo desbloquear (unlock).
  2. Haga clic en el botón Promocionar en espera (Promote Standby) del área Acciones disponibles (Available Actions) en la pantalla de Orchestrator en espera.

    Aparece el siguiente cuadro de diálogo, que indica que, cuando se promociona una instancia en espera de Orchestrator, los administradores ya no pueden administrar SASE Orchestrator con la instancia activa de Orchestrator anterior.

  3. Haga clic en el botón Promocionar en espera (Promote Standby) para promocionar la instancia de Orchestrator en espera.
  4. Haga clic en Forzar promoción a en espera (Force Promote Standby) para promocionar la instancia de Orchestrator.

    Se abre un cuadro de diálogo final que indica que la instancia de Orchestrator ya no está en espera y se reinicia en modo independiente.

Cuando se promociona una instancia de Orchestrator en espera, se reinicia en modo independiente.

Si el modo de espera se puede comunicar con la instancia de Orchestrator activa anteriormente, indica que Orchestrator debe entrar en estado inerte. En el estado inerte, Orchestrator comunica a sus clientes (instancias de Edge, puertas de enlace, interfaz de usuario/API) que ya no está activo y que deben comunicarse con la instancia de Orchestrator recientemente promocionada. Si el modo de espera promocionado no puede comunicarse con la instancia de Orchestrator activa anteriormente, el operador debe, si es posible, degradar manualmente la instancia de Orchestrator activa anteriormente.

Volver al modo independiente

Para devolver el modo inerte al modo independiente, haga clic en el botón Volver al modo independiente (Return to Standalone Mode) del área Acciones disponibles (Available Actions) de las pantallas Orchestrator activo (Active Orchestrator) u Orchestrator en espera (Standby Orchestrator).

Nota:

Orchestrator se puede devolver al modo independiente desde el estado inerte después del tiempo especificado en la propiedad del sistema "vco.disasterRecovery.zombie.expirySeconds", que tiene el valor predeterminado de 1800 segundos.

Solucionar problemas de recuperación ante desastres de SASE Orchestrator

En esta sección se describen los estados de error del sistema. También se enumeran en la interfaz de usuario, junto con una descripción más detallada del error. Puede obtener más información en el registro de VMware.

Errores recuperables

Los siguientes son errores recuperables que pueden producirse cuando la recuperación ante desastres de SASE Orchestrator llega a un estado de sincronización. Si se corrige el problema que provoca estos errores, SASE Orchestrator la recuperación ante desastres regresa automáticamente al funcionamiento normal.

  • FAILURE_SYNCING_FILES
  • FAILURE_GET_STANDBY_STATUS
  • FAILURE_MYSQL_ACTIVE_STATUS
  • FAILURE_MYSQL_STANDBY_STATUS

Errores irrecuperables

Los siguientes errores se pueden producir durante la configuración de la recuperación ante desastres de SASE Orchestrator. La recuperación ante desastres de SASE Orchestrator no se recupera automáticamente de estos errores.

  • FAILURE_ACTIVE_CONFIGURING
  • FAILURE_LAUNCHING_STANDBY
  • FAILURE_STANDBY_CONFIGURING
  • FAILURE_COPYING_DB
  • FAILURE_COPYING_FILES
  • FAILURE_SYNC_CONFIGURING
  • FAILURE_GET_STANDBY_CONFIG
  • FAILURE_STANDBY_CANDIDATE
  • FAILURE_STANDBY_UNCONFIG
  • FAILURE_STANDBY_PROMOTION
  • FAILURE_ACTIVE_DEMOTION