VMware Aria Operations es compatible con la disponibilidad continua (CA). La CA separa el clúster de VMware Aria Operations en dos dominios de error, que se extienden en todos los clústeres de vSphere y protege el clúster de análisis de la pérdida de un dominio de error completo.

Puede configurar el clúster de análisis con disponibilidad continua. Esto permite que los nodos del clúster se expandan entre dos dominios de error. Un dominio de error consta de uno o más nodos de análisis agrupados según su ubicación física en el centro de datos. Con CA, los dos dominios de error permiten que VMware Aria Operations tolere errores de una ubicación física completa y errores de los recursos dedicados a un solo dominio de error.

Para activar la disponibilidad continua en VMware Aria Operations, el nodo testigo debe estar implementado en el clúster. El clúster de VMware Aria Operations solo puede tener un nodo testigo. El nodo testigo no recopila ni almacena datos. En una situación en la que se pierde la conectividad de red entre los dos dominios de error, el clúster entrará en una situación de "cerebro dividido". El nodo testigo detecta esta situación y uno de los dominios de error se desconecta para evitar problemas de incoherencia en los datos. Verá un botón de Conectar en la interfaz de usuario de administrador de los nodos que el nodo testigo ha desconectado. Antes de usar esta opción para conectar el dominio de error, asegúrese de que la conectividad de red entre los nodos de los dos dominios de error se haya restaurado y sea estable. Una vez confirmado, puede conectar el dominio de error.

Con CA, los datos almacenados en el nodo primario y los nodos de datos agrupados en el dominio de error 1 siempre se sincronizan al 100 % con el nodo de réplica y los nodos de datos emparejados en el dominio de error 2. Para activar CA, debe contar con un nodo de datos implementado como mínimo, además del nodo primario. Si tiene más de un nodo de datos, debe haber un número par de nodos de datos, incluido el nodo primario. Por ejemplo, el clúster debe tener 2, 4, 6, 8, 10, 12, 14 o 16 nodos en función de los requisitos de tamaño adecuados. Los datos almacenados en el nodo primario del dominio de error 1 se almacenan y replican en el nodo de réplica del dominio de error 2. Los datos almacenados en los nodos de datos del dominio de error 1 se almacenan y replican en los nodos de datos emparejados del dominio de error 2. Sin embargo, si se produce un error en el nodo primario, solo el nodo de réplica puede funcionar como reemplazo del nodo primario.

  • La CA protege el clúster de análisis de la pérdida de la mitad de los nodos de análisis específicos de un dominio de error. Puede expandir los nodos en clústeres de vSphere para tratar de aislar nodos o crear áreas de fallos.
  • Cuando CA está activada, el nodo de réplica puede asumir todas las funciones que proporciona el nodo primario, en caso de que se produzca un fallo en el nodo primario. La conmutación por error al nodo de réplica es automática y solo requiere de dos a tres minutos de inactividad de VMware Aria Operations para reanudar las operaciones y reiniciar la recopilación de datos.
    Nota: Si falla el nodo primario, el nodo de réplica se convierte en el nodo primario y el clúster se ejecuta en modo degradado. Para solucionarlo, realice una de las siguientes acciones.
    • Corrija manualmente el fallo del nodo primario.
    • Para volver al modo de CA, reemplace el nodo primario. Los nodos de reemplazo no reparan el fallo de nodo; en su lugar, un nuevo nodo asume la función de nodo primario.
  • En la interfaz de administración, después de que un nodo de réplica de CA tome el control y se convierta en el nuevo nodo primario, no se puede eliminar el nodo primario anterior sin conexión desde el clúster. Además, el nodo anterior continúa apareciendo en la lista como nodo primario. Para actualizar la pantalla y activar la eliminación del nodo, actualice el navegador.
  • Cuando CA está activada, el clúster puede resistir la pérdida de la mitad los nodos de datos de un dominio de error sin perder ningún dato. La CA protege de la pérdida de un solo dominio de error cada vez. No se admite la pérdida simultánea de datos y nodos primario/de réplica, o dos o más nodos de datos en ambos dominios de error.
  • Un clúster activado para CA no funcionará si desconecta el nodo primario o la réplica del nodo primario mientras uno de los dominios de error está inactivo.
  • Cuando CA está activada, se reduce a la mitad la capacidad y el procesamiento de VMware Aria Operations, ya que CA crea una copia redundante de los datos de todo el clúster, así como la copia de seguridad de réplica del nodo primario. Tenga en cuenta el posible uso de CA durante la planificación del número y tamaño de los nodos del clúster de VMware Aria Operations. Consulte Ajuste de tamaño del clúster de VMware Aria Operations.
  • Cuando CA está activada, implemente nodos del clúster de análisis, en cada dominio de error, en hosts distintos para su redundancia y aislamiento. También puede utilizar reglas de incompatibilidad para mantener los nodos en hosts específicos en los clústeres de vSphere.
  • Aunque no pueda mantener los nodos separados en cada dominio de error, podrá seguir activando CA. Un error de host puede provocar la pérdida de los nodos de datos en el dominio de error y que VMware Aria Operations siga disponible en el otro dominio de error.
  • Si no puede repartir los nodos de datos en diferentes clústeres de vSphere, no active CA. Un fallo del clúster puede provocar la pérdida de más de la mitad de los nodos de datos, lo que resulta incompatible, con lo que todas las características de vSphere quedarían inutilizables.
  • Sin CA, puede mantener los nodos del mismo host en el mismo vSphere. Sin CA, la pérdida de incluso un nodo inutilizaría todas las características de VMware Aria Operations.
  • La acción de desconectar los nodos de datos en ambos dominios de error y cambiar la configuración de red de las máquinas virtuales afecta a la dirección IP de los nodos de datos. Tras esto, el clúster de CA dejará de estar disponible y el estado de todos los nodos cambia a "Waiting for analytics". Compruebe que ha utilizado una dirección IP estática.
  • Cuando se elimina un nodo que tenga uno o varios adaptadores vCenter configurados para recopilar datos de un clúster con CA activada, uno o varios adaptadores vCenter asociados a dicho nodo dejarán de recopilar. Debe cambiar la configuración de los adaptadores para fijarlos a otro nodo antes de eliminar el nodo.
  • La interfaz de administración muestra el número de cachés de recurso, que se crea solo para objetos activos, pero en el Inventario aparecen todos los objetos. Al eliminar un nodo de un clúster con CA activada para permitir que los adaptadores de vCenter recopilen datos y reequilibren cada nodo, el inventario muestra una cantidad diferente de objetos de la que se muestra en la interfaz de administración.