Introducción a los clústeres ampliados

Los clústeres ampliados extienden el clúster de vSAN de un solo sitio de datos a dos sitios para aumentar el nivel de disponibilidad y el equilibrio de carga entre sitios. Los clústeres ampliados en general se implementan en entornos donde la distancia entre los centros de datos es limitada, por ejemplo, entornos metropolitanos o de campus.

Los clústeres ampliados se pueden utilizar para administrar el mantenimiento planificado y evitar situaciones problemáticas, ya que el mantenimiento o la pérdida de un sitio no afectan la operación general del clúster. En la configuración de un clúster ampliado, los dos sitios de datos son sitios activos. Si uno de los sitios tiene errores, vSAN usa el almacenamiento del otro sitio. vSphere HA reinicia las máquinas virtuales que deben reiniciarse en el sitio activo restante.

Debe designar un sitio como el sitio preferido. El otro sitio es el secundario o no preferido. El sistema utiliza el sitio preferido solo en casos donde se produce una pérdida de conexión de red entre los dos sitios activos. Por lo general, el sitio designado como preferido es el que permanece en funcionamiento, a menos que el sitio preferido se vuelva a sincronizar o presente otro problema. El sitio que ofrece la máxima disponibilidad de datos es el que se mantiene en funcionamiento.

Un clúster ampliado de vSAN puede tolerar un error de vínculo por vez sin perder la disponibilidad de los datos. Un error de vínculo es una pérdida de conexión de red entre los dos sitios o entre un sitio y el host testigo. Durante el error de un sitio o la pérdida de conexión de red, vSAN cambia de manera automática a sitios funcionales en su totalidad.

Para obtener más información sobre el trabajo con clústeres ampliados, consulte la guía de clúster ampliado de vSAN.

Host testigo

Cada clúster ampliado está formado por dos sitios de datos y un host testigo. El host testigo reside en un tercer sitio y contiene los componentes testigo de los objetos de la máquina virtual. Solo contiene metadatos, y no participa de las operaciones de almacenamiento.

El host testigo sirve como factor determinante cuando se debe tomar una decisión en relación con la disponibilidad de los componentes del almacén de datos cuando se pierde la conexión de red entre dos sitios. En este caso, el host testigo por lo general forma un clúster de vSAN con el sitio preferido. Pero si el sitio preferido queda aislado del sitio secundario y del testigo, el host testigo forma un clúster con el sitio secundario. Una vez que el sitio preferido está conectado nuevamente, se vuelven a sincronizar los datos para garantizar que ambos sitios posean las copias más recientes de todos los datos.

Si se produce un error en el host testigo, todos los objetos correspondientes dejan de ser compatibles, pero se puede acceder a ellos en su totalidad.

El host testigo tiene las siguientes características:

El host testigo puede utilizar vínculos de poco ancho de banda/latencia alta.
El host testigo no puede ejecutar máquinas virtuales.
Un solo host testigo admite solamente un clúster ampliado de vSAN.
El host testigo debe tener un adaptador de VMkernel con tráfico de vSAN habilitado y conexiones a todos los hosts del clúster. El host testigo usa un adaptador de VMkernel para la administración y otro adaptador de VMkernel para el tráfico de datos de vSAN. El host testigo solo puede tener un adaptador de VMkernel dedicado a vSAN.
El host testigo debe ser un host independiente dedicado al clúster ampliado. No se puede agregar a ningún otro clúster ni mover en el inventario mediante vCenter Server.

El host testigo puede ser un host físico o un host ESXi que se ejecuta en una máquina virtual. El host testigo de máquina virtual no proporciona otro tipo de funcionalidad, como almacenamiento o ejecución de máquinas virtuales. Se pueden ejecutar varios hosts testigo como máquinas virtuales en un solo servidor físico. En el caso de las revisiones y la configuración básica de redes y supervisión, el host testigo de máquina virtual funciona de la misma forma que lo hace un host ESXi típico. Puede administrarlo con vCenter Server, aplicar revisiones y actualizaciones mediante esxcli o vSphere Update Manager, y supervisarlo con herramientas estándar que interactúen con hosts ESXi.

Puede usar un dispositivo virtual testigo como host testigo en un clúster ampliado. El dispositivo virtual testigo es un host ESXi en una máquina virtual, empaquetado como OVF u OVA. El dispositivo está disponible en varias opciones, según el tamaño de la implementación.

Clústeres ampliados y dominios de errores

Los clústeres ampliados utilizan dominios de errores para proporcionar redundancia y protección contra errores en los sitios. Cada sitio de un clúster ampliado reside en un dominio de errores distinto.

Un clúster ampliado requiere tres dominios de errores: el sitio preferido, el sitio secundario y el host testigo. Cada dominio de errores representa un sitio independiente. Cuando el host testigo presenta un error o entra en modo de mantenimiento, vSAN lo considera un error de sitio.

En vSAN 6.6 y las versiones posteriores, es posible ofrecer un nivel adicional de protección contra errores locales para los objetos de máquinas virtuales en clústeres ampliados. Al configurar un clúster ampliado, las siguientes reglas de directivas quedan disponibles para los objetos en el clúster:

Nivel primario de errores que se toleran (Primary level of failures to tolerate, PFTT). Para los clústeres ampliados, PFTT define el número de errores de sitios que puede tolerar un objeto de máquina virtual. Para un clúster ampliado, solo se admite un valor de 0 o 1.
Nivel secundario de errores que se toleran (Secondary level of failures to tolerate, SFTT). Para los clústeres ampliados, SFTT define el número de errores de host adicionales que puede tolerar el objeto después de alcanzar el número de errores de sitios definido por PFTT. Si PFTT es igual a 1 y SFTT es igual a 2, y un sitio no está disponible, el clúster puede tolerar dos errores de host adicionales.
El valor predeterminado es 0 y el máximo es 3.
Localidad de datos. Esta regla está disponible únicamente si PFTT = 0. Puede configurar la regla Localidad de datos como Ninguna, Preferida o Secundaria. Esta regla permite limitar los objetos de una máquina virtual a un sitio seleccionado en el clúster ampliado. El valor predeterminado es None (Ninguno).

Nota: Al configurar el valor de SFTT para el clúster ampliado, se aplica la regla Método de tolerancia a errores a SFTT. El método de tolerancia a errores utilizado para PFTT se establece en RAID 1.

En un clúster ampliado con protección contra errores locales, el clúster puede ejecutar reparaciones de los componentes faltantes o dañados en el sitio disponible, incluso cuando un sitio no está disponible.