vSphere Distributed Services Engine® es una capacidad de vSphere básica que permite a los clientes utilizar varias DPU con vSphere y VMware Cloud Foundation.
vSphere 8.0 permite un rendimiento de las cargas de trabajo sin precedentes para satisfacer las necesidades de rendimiento y latencia cada vez mayores. Con vSphere Distributed Services Engine, los servicios de infraestructura se distribuyen entre los diferentes recursos informáticos disponibles en el host ESXi, liberando a la DPU de algunas funciones de red. Esta capacidad funciona bien con las aplicaciones modernas, que se desarrollan utilizando un enfoque de arquitectura de microservicios que busca descomponer la aplicación en varios servicios independientes pero que colaboran. Esta mayor complejidad genera nuevas demandas para la CPU. Por ejemplo, procesar solicitudes de almacenamiento o transferir tráfico de red para estos microservicios deja menos ciclos de CPU para la carga de trabajo real. En este contexto, los aceleradores especialmente diseñados como las DPU pueden asumir la nueva carga informática y ayudar a mejorar el rendimiento y la eficiencia de la infraestructura.
Con vSphere Distributed Services Engine, las DPU pueden acelerar el rendimiento de la red y aumentar el rendimiento de los datos, a la vez que no suponen una carga operativa para la administración del ciclo de vida de las DPU, ya que la experiencia existente de Día 0, Día 1 y Día 2 de vSphere no cambia. vSphere Distributed Services Engine es compatible con unidades DPU de NVIDIA y AMD, y con diseños de servidor de Dell, HPE, Lenovo y Fujitsu. vSphere Distributed Services Engine está disponible en servidores con unidades DPU preinstaladas.
A partir de vSphere 8.0, puede descargar la funcionalidad que se ejecuta en la CPU principal en la DPU para mejorar significativamente el rendimiento de red y seguridad. Como se ilustra en el diagrama de arquitectura del vSphere continua, las DPU también pueden gestionar capacidades adicionales, como la descarga de almacenamiento y la administración nativa, pero actualmente no se admiten estas capacidades adicionales.
vSphere Distributed Services Engine descarga y acelera las funciones de infraestructura en la DPU mediante la introducción de un VMware vSphere Distributed Switch en la DPU y NSX Networking and Observability de VMware, que permite supervisar, identificar y mitigar de forma proactiva los cuellos de botella de la infraestructura de red sin derivaciones a la red complejas. La DPU se convierte en un nuevo punto de control para escalar funciones de infraestructura y habilita controles de seguridad sin agente y desacoplados del dominio de la carga de trabajo.
Con vSphere Distributed Services Engine podrá:
- Instalar y actualizar imágenes ESXi simultáneamente en el servidor x86 y la DPU compatible asociada para reducir la sobrecarga operativa de la administración del ciclo de vida de las unidades DPU con flujos de trabajo de vSphere integrados. Para obtener más información, consulte Usar vSphere Lifecycle Manager con VMware vSphere Distributed Services Engine.
- Establecer alarmas para alertas de hardware de DPU y supervisar las métricas de rendimiento del núcleo, la memoria y la red desde interfaces conocidas de vCenter, sin necesidad de nuevas herramientas. Para obtener más información, consulte CPU (DPU) y Memoria (DPU).
- Acelerar vSphere Distributed Switch en la DPU para mejorar el rendimiento de la red y utilizar ciclos de CPU disponibles para lograr una mayor consolidación de la carga de trabajo por host ESXi. Para obtener más información, consulte ¿Qué es la capacidad de descongestión de la red? y Crear una instancia de vSphere Distributed Switch.
- Conseguir compatibilidad con vSphere DRS y vSphere vMotion para máquinas virtuales que se ejecutan en hosts con DPU asociadas para obtener los beneficios del acceso directo sin sacrificar la portabilidad de la máquina virtual. Para obtener más información, consulte Clústeres homogéneos para DPU.
- Mejorar la seguridad de la infraestructura con seguridad de confianza cero. Para obtener más información, consulte Prácticas recomendadas de seguridad para vSphere Distributed Services Engine.
vSphere Distributed Services Engine no requiere una licencia de ESXi independiente. Una red interna que está aislada de otras redes conecta las DPU con los hosts ESXi. Las compilaciones del servidor ESXi 8.0 son imágenes unificadas, que contienen contenido x86 y DPU. En el sistema vSphere, las DPU se ven como objetos nuevos durante la instalación y la actualización, así como en los flujos de trabajo de perfiles de host, almacenamiento y redes.
Alta disponibilidad con VMware vSphere Distributed Services Engine
Con ESXi 8.0 Update 3, puede optar por una instalación de VMware vSphere Distributed Services Engine con dos unidades de procesamiento de datos (data processing unit, DPU) para lograr una alta disponibilidad.
En sistemas de vSphere con una sola DPU, el dispositivo puede convertirse en el único punto de error para las cargas de trabajo descargadas en la DPU, como las funciones de red, y que esto repercuta en los datos y la productividad. Con ESXi 8.0 Update 3, vSphere Distributed Services Engine también está disponible en servidores con dos DPU preinstaladas, lo que proporciona redundancia y resistencia de hardware.
Puede utilizar las dos DPU en modo activo/en espera para proporcionar alta disponibilidad. Esta configuración proporciona redundancia en el caso de que se produzca un error en una de las DPU. En la configuración de alta disponibilidad, ambas DPU se asignan a la misma instancia de vSphere Distributed Switch respaldada por NSX. Por ejemplo, DPU-1 se asocia a vmnic0 y vmnic1 de vSphere Distributed Switch y DPU-2 se asocia a vmnic2 y vmnic3 de la misma instancia de vSphere Distributed Switch.
También puede utilizar las dos DPU como dispositivos independientes para aumentar la capacidad de descarga por host ESXi. Cada DPU se asocia a una instancia de vSphere Distributed Switch independiente y no hay conmutación por error entre las DPU en dicha configuración.
Los sistemas de doble DPU pueden utilizar dispositivos NVIDIA o Pensando. En ESXi 8.0 Update 3, los sistemas de doble DPU son compatibles con los diseños de servidor de Lenovo. Los dispositivos de DPU que están en un servidor de doble DPU deben ser idénticos en todos los aspectos: el mismo proveedor, la misma versión de hardware y el mismo firmware. Para obtener una lista de los proveedores actuales y los diseños de servidor para VMware vSphere Distributed Services Engine, consulte la Guía de compatibilidad de VMware.
Instalación de VMware vSphere Distributed Services Engine con dos DPU
vSphere Distributed Services Engine no requiere una licencia de ESXi independiente. Las compilaciones de servidor de ESXi 8.0 Update 3 son imágenes unificadas, las cuales contienen contenido de x86 y DPU, y no se puede instalar contenido de x86 y DPU por separado. El procedimiento de instalación en ambas DPU, ya sean interactivas o generadas por script, también se produce en paralelo y se observa una pérdida de rendimiento mínima en comparación con un sistema de una DPU.
Para obtener más información sobre la instalación, consulte Instalar ESXi de forma interactiva y Scripts de instalación y actualización utilizados para la instalación de ESXi.
Gestión de errores, conmutación por error y reversión para VMware vSphere Distributed Services Engine
Antes de instalar VMware vSphere Distributed Services Engine, consulte las opciones de gestión de errores, conmutación por error y reversión.
Gestión de errores
Un error en la instalación del contenido x86 y DPU en un host ESXi marca todo el procedimiento de instalación como erróneo.
Si bien lo que se espera es que el estado del software de las DPU siga siendo idéntico en todo momento, en el poco probable caso de que se produzca un error durante una operación de ciclo de vida, como la instalación o la actualización de un componente, la operación puede realizarse correctamente en una DPU, pero puede producirse un error en la otra. Dado que cada operación de ciclo de vida se produce dentro de los límites de cada DPU, los errores no afectan al estado de la otra DPU, pero el resultado general de la instalación sí sigue marcado como error.
Durante la instalación interactiva, en los flujos de trabajo de vSphere Lifecycle Manager, y cuando se utiliza ESXCLI, se recibe información sobre la DPU en la que se produjo un error en la operación.
Tras una instalación correcta, en caso de haber errores de DPU, la acción recomendada es reiniciar el host ESXi afectado. Si sigue siendo posible acceder a la DPU desde el host, la recopilación de paquetes de registro general es suficiente para la solución de problemas. Si no se puede acceder a la DPU desde el host, el inicio de sesión en la DPU desde una interfaz BMC, iLO o iDRAC puede proporcionar registros de solución de problemas.
Conmutación por error
La compatibilidad con la conmutación por error en vSphere 8.0 Update 3 se limita a que una de las DPU deje de funcionar debido a errores de software dentro de la DPU o a una desconexión física de una de las DPU, como la desconexión de cable. No se admite la conmutación por error debido a errores de nivel de interconexión de componentes periféricos (Peripheral Component Interconnect, PCI).
Revertir
La reversión es un mecanismo de mejor esfuerzo para restaurar el sistema a un estado de funcionamiento anterior en caso de que se produzca un error antes de la fase de inicio del arranque de ESXi. La reversión en ambos servidores x86 y las DPU compatibles asociadas es automática en caso de que se produzca un error durante el arranque. También puede optar por una reversión manual si pulsa Mayús+R antes de que se inicie el cargador de arranque para volver a un buen estado anterior.
Cualquier error que se produzca después de que se inicie la fase de inicio no provoca una reversión.
Situación | Número de reinicios necesarios |
---|---|
Ambas DPU arrancan correctamente. ESXi no arranca correctamente. | 2 |
Ambas DPU no arrancan correctamente. ESXi arranca correctamente. | 1 |
Una de las DPU arranca con una versión anterior a la otra DPU y ESXi. | 2 |
Una de las DPU arranca con una versión anterior a la otra DPU y ESXi no arranca correctamente. | 2 |