Puede utilizar vMotion para realizar una migración en vivo de máquinas virtuales con tecnología NVIDIA vGPU sin causar pérdida de datos.

Para habilitar vMotion para máquinas virtuales de vGPU, debe establecer la configuración avanzada de vgpu.hotmigrate.enabled en true. Para obtener más información sobre cómo establecer la configuración avanzada de vCenter Server, consulte Configurar opciones avanzadas en la documentación de Configuración de vCenter Server.

En vSphere 6.7 Update 1 y vSphere 6.7 Update 2, cuando se migran máquinas virtuales de vGPU con vMotion y el tiempo de paralización de vMotion supera los 100 segundos, se puede producir un error en el proceso de migración para los perfiles de vGPU con un tamaño de búfer de trama de 24 GB o más. Para evitar que se agote el tiempo de espera de vMotion, actualice a vSphere 6.7 Update 3 o una versión posterior.

Durante el tiempo de paralización, no se puede acceder a la máquina virtual, al escritorio ni a la aplicación. Una vez que se completa la migración, se reanuda el acceso a la máquina virtual, y todas las aplicaciones continúan desde el estado anterior. Para obtener información sobre el tamaño del búfer de trama en los perfiles de vGPU, consulte la documentación de la GPU virtual NVIDIA.

Los tiempos de paralización de máquina virtual esperados (el momento en el que los usuarios no pueden acceder a la máquina virtual durante vMotion) y los tiempos de paralización estimados en el peor de los casos, se enumeran en las siguiente tablas. Los tiempos de paralización esperados se probaron en una red de 10 GB con GPU NVIDIA Tesla V100 PCIe de 32 GB:

Tabla 1. Tiempos esperados de paralización para vMotion de las máquinas virtuales de vGPU
Búfer de trama de vGPU usado (GB) Tiempo de paralización de máquina virtual (s)
1 2
2 4
4 6
8 12
16 22
32 39
Tabla 2. Tiempos de paralización estimados en el peor caso (seg.)
Memoria de vGPU 4 GB de memoria de la máquina virtual 8 GB de memoria de la máquina virtual 16 GB de memoria de la máquina virtual 32 GB de memoria de la máquina virtual
1 GB 5 6 8 12
2 GB 7 9 11 15
4 GB 13 14 16 21
8 GB 24 25 28 32
16 GB 47 48 50 54
32 GB 91 92 95 99
Nota: Cuando tenga en cuenta los tiempos de paralización esperados y estimados del peor caso, tenga en cuenta los siguientes puntos:
  • El perfil de vGPU configurado representa un límite superior para el búfer de trama de vGPU utilizado. En muchos casos prácticos, la cantidad de memoria de búfer de trama de vGPU utilizada por la máquina virtual en un momento dado está por debajo de la memoria de vGPU asignada en el perfil.
  • Tanto los tiempos de paralización esperados como los estimados de peores casos solo son válidos cuando se migra una sola máquina virtual. Si va a migrar varias máquinas virtuales simultáneamente, es decir, para un proceso de corrección manual de vSphere, los tiempos de paralización tendrán efectos negativos.
  • Las estimaciones anteriores asumen suficiente capacidad de CPU, memoria, PCIe y red para alcanzar un rendimiento de migración de 10 Gbps.

DRS es compatible con la colocación inicial de las máquinas virtuales de vGPU que ejecutan vSphere 6.7 Update 1 y versiones posteriores sin compatibilidad con el equilibrio de carga.

VMware vSphere vMotion solo se admite con y entre modelos compatibles de dispositivos de GPU NVIDIA y las versiones de controladores de host de NVIDIA GRID según las define y admite NVIDIA. Para obtener información sobre la compatibilidad, consulte la guía de usuario de la GPU virtual NVIDIA.

Para comprobar la compatibilidad entre los controladores de host de NVIDIA vGPU, vSphere y Horizon, consulte la matriz de compatibilidad de VMware.