vSphere Distributed Services Engine® es una capacidad de vSphere básica que permite a los clientes utilizar varias DPU con vSphere y VMware Cloud Foundation.

vSphere 8.0 permite un rendimiento de las cargas de trabajo sin precedentes para satisfacer las necesidades de rendimiento y latencia cada vez mayores. Con vSphere Distributed Services Engine, los servicios de infraestructura se distribuyen entre los diferentes recursos informáticos disponibles en el host ESXi, liberando a la DPU de algunas funciones de red. Esta capacidad funciona bien con las aplicaciones modernas, que se desarrollan utilizando un enfoque de arquitectura de microservicios que busca descomponer la aplicación en varios servicios independientes pero que colaboran. Esta mayor complejidad genera nuevas demandas para la CPU. Por ejemplo, procesar solicitudes de almacenamiento o transferir tráfico de red para estos microservicios deja menos ciclos de CPU para la carga de trabajo real. En este contexto, los aceleradores especialmente diseñados como las DPU pueden asumir la nueva carga informática y ayudar a mejorar el rendimiento y la eficiencia de la infraestructura.

Con vSphere Distributed Services Engine, las DPU pueden acelerar el rendimiento de la red y aumentar el rendimiento de los datos, a la vez que no suponen una carga operativa para la administración del ciclo de vida de las DPU, ya que la experiencia existente de Día 0, Día 1 y Día 2 de vSphere no cambia. vSphere Distributed Services Engine es compatible con unidades DPU de NVIDIA y AMD, y con diseños de servidor de Dell, HPE, Lenovo y Fujitsu. vSphere Distributed Services Engine está disponible en servidores con unidades DPU preinstaladas.

A partir de vSphere 8.0, puede descargar la funcionalidad que se ejecuta en la CPU principal en la DPU para mejorar significativamente el rendimiento de red y seguridad. Como se ilustra en el diagrama de arquitectura del vSphere continua, las DPU también pueden gestionar capacidades adicionales, como la descarga de almacenamiento y la administración nativa, pero actualmente no se admiten estas capacidades adicionales.

Figura 1. Arquitectura de vSphere continua.
VMware traslada cierta funcionalidad que se ejecuta en el complejo de la CPU principal al complejo de CPU de DPU para habilitar la aceleración de la red.

vSphere Distributed Services Engine descarga y acelera las funciones de infraestructura en la DPU mediante la introducción de un VMware vSphere Distributed Switch en la DPU y NSX Networking and Observability de VMware, que permite supervisar, identificar y mitigar de forma proactiva los cuellos de botella de la infraestructura de red sin derivaciones a la red complejas. La DPU se convierte en un nuevo punto de control para escalar funciones de infraestructura y habilita controles de seguridad sin agente y desacoplados del dominio de la carga de trabajo.

Con vSphere Distributed Services Engine podrá:

vSphere Distributed Services Engine no requiere una licencia de ESXi independiente. Una red interna que está aislada de otras redes conecta las DPU con los hosts ESXi. Las compilaciones del servidor ESXi 8.0 son imágenes unificadas, que contienen contenido x86 y DPU. En el sistema vSphere, las DPU se ven como objetos nuevos durante la instalación y la actualización, así como en los flujos de trabajo de perfiles de host, almacenamiento y redes.

Alta disponibilidad con VMware vSphere Distributed Services Engine

Con ESXi 8.0 Update 3, puede optar por una instalación de VMware vSphere Distributed Services Engine con dos unidades de procesamiento de datos (data processing unit, DPU) para lograr una alta disponibilidad.

En sistemas de vSphere con una sola DPU, el dispositivo puede convertirse en el único punto de error para las cargas de trabajo descargadas en la DPU, como las funciones de red, y que esto repercuta en los datos y la productividad. Con ESXi 8.0 Update 3, vSphere Distributed Services Engine también está disponible en servidores con dos DPU preinstaladas, lo que proporciona redundancia y resistencia de hardware.

Puede utilizar las dos DPU en modo activo/en espera para proporcionar alta disponibilidad. Esta configuración proporciona redundancia en el caso de que se produzca un error en una de las DPU. En la configuración de alta disponibilidad, ambas DPU se asignan a la misma instancia de vSphere Distributed Switch respaldada por NSX. Por ejemplo, DPU-1 se asocia a vmnic0 y vmnic1 de vSphere Distributed Switch y DPU-2 se asocia a vmnic2 y vmnic3 de la misma instancia de vSphere Distributed Switch.

También puede utilizar las dos DPU como dispositivos independientes para aumentar la capacidad de descarga por host ESXi. Cada DPU se asocia a una instancia de vSphere Distributed Switch independiente y no hay conmutación por error entre las DPU en dicha configuración.

Los sistemas de doble DPU pueden utilizar dispositivos NVIDIA o Pensando. En ESXi 8.0 Update 3, los sistemas de doble DPU son compatibles con los diseños de servidor de Lenovo. Los dispositivos de DPU que están en un servidor de doble DPU deben ser idénticos en todos los aspectos: el mismo proveedor, la misma versión de hardware y el mismo firmware. Para obtener una lista de los proveedores actuales y los diseños de servidor para VMware vSphere Distributed Services Engine, consulte la Guía de compatibilidad de VMware.

Instalación de VMware vSphere Distributed Services Engine con dos DPU

vSphere Distributed Services Engine no requiere una licencia de ESXi independiente. Las compilaciones de servidor de ESXi 8.0 Update 3 son imágenes unificadas, las cuales contienen contenido de x86 y DPU, y no se puede instalar contenido de x86 y DPU por separado. El procedimiento de instalación en ambas DPU, ya sean interactivas o generadas por script, también se produce en paralelo y se observa una pérdida de rendimiento mínima en comparación con un sistema de una DPU.

Con vSphere 8.0 Update 3, puede obtener una configuración de servidor preinstalada con dos DPU de Dell o Lenovo, o bien puede agregar una segunda DPU a un sistema de una DPU en los servidores de doble DPU compatibles de Dell o Lenovo.
Nota: En cualquier caso, debe ejecutar una nueva instalación completa de ESXi 8.0 Update 3 en el sistema, no solo en las DPU recién agregadas.

Para obtener más información sobre la instalación, consulte Instalar ESXi de forma interactiva y Scripts de instalación y actualización utilizados para la instalación de ESXi.

Gestión de errores, conmutación por error y reversión para VMware vSphere Distributed Services Engine

Antes de instalar VMware vSphere Distributed Services Engine, consulte las opciones de gestión de errores, conmutación por error y reversión.

Gestión de errores

Un error en la instalación del contenido x86 y DPU en un host ESXi marca todo el procedimiento de instalación como erróneo.

Si bien lo que se espera es que el estado del software de las DPU siga siendo idéntico en todo momento, en el poco probable caso de que se produzca un error durante una operación de ciclo de vida, como la instalación o la actualización de un componente, la operación puede realizarse correctamente en una DPU, pero puede producirse un error en la otra. Dado que cada operación de ciclo de vida se produce dentro de los límites de cada DPU, los errores no afectan al estado de la otra DPU, pero el resultado general de la instalación sí sigue marcado como error.

Durante la instalación interactiva, en los flujos de trabajo de vSphere Lifecycle Manager, y cuando se utiliza ESXCLI, se recibe información sobre la DPU en la que se produjo un error en la operación.

Tras una instalación correcta, en caso de haber errores de DPU, la acción recomendada es reiniciar el host ESXi afectado. Si sigue siendo posible acceder a la DPU desde el host, la recopilación de paquetes de registro general es suficiente para la solución de problemas. Si no se puede acceder a la DPU desde el host, el inicio de sesión en la DPU desde una interfaz BMC, iLO o iDRAC puede proporcionar registros de solución de problemas.

Conmutación por error

La compatibilidad con la conmutación por error en vSphere 8.0 Update 3 se limita a que una de las DPU deje de funcionar debido a errores de software dentro de la DPU o a una desconexión física de una de las DPU, como la desconexión de cable. No se admite la conmutación por error debido a errores de nivel de interconexión de componentes periféricos (Peripheral Component Interconnect, PCI).

Revertir

La reversión es un mecanismo de mejor esfuerzo para restaurar el sistema a un estado de funcionamiento anterior en caso de que se produzca un error antes de la fase de inicio del arranque de ESXi. La reversión en ambos servidores x86 y las DPU compatibles asociadas es automática en caso de que se produzca un error durante el arranque. También puede optar por una reversión manual si pulsa Mayús+R antes de que se inicie el cargador de arranque para volver a un buen estado anterior.

Cualquier error que se produzca después de que se inicie la fase de inicio no provoca una reversión.

Tabla 1. Escenarios de reversión para la instalación de VMware vSphere Distributed Services Engine
Situación Número de reinicios necesarios
Ambas DPU arrancan correctamente. ESXi no arranca correctamente. 2
Ambas DPU no arrancan correctamente. ESXi arranca correctamente. 1
Una de las DPU arranca con una versión anterior a la otra DPU y ESXi. 2
Una de las DPU arranca con una versión anterior a la otra DPU y ESXi no arranca correctamente. 2