vSphere Distributed Services Engine® est une fonctionnalité principale de vSphere qui permet aux clients d'utiliser des DPU avec vSphere et VMware Cloud Foundation.

vSphere 8.0 offre des performances de charge de travail révolutionnaires pour répondre à des besoins toujours croissants en matière de débit et de latence. Avec vSphere Distributed Services Engine, les services d'infrastructure sont distribués entre les différentes ressources de calcul disponibles sur l'hôte ESXi, les fonctions de mise en réseau étant déchargées sur le DPU. Cette fonctionnalité est très utile pour les applications modernes développées à l'aide d'une approche d'architecture de microservices, qui cherche à diviser l'application en plusieurs services indépendants, mais coopératifs. Cette complexité accrue crée une nouvelle demande pour le CPU. Par exemple, le traitement des demandes de stockage ou la circulation du trafic réseau pour ces microservices laisse moins de cycles de CPU pour la charge de travail réelle. Dans ce contexte, les accélérateurs spécialisés tels que les DPU peuvent prendre en charge la nouvelle charge de calcul et vous aider à améliorer les performances et l'efficacité de l'infrastructure.

Avec vSphere Distributed Services Engine, les DPU peuvent accélérer les performances de votre réseau et augmenter le débit de données, tout en n'imposant aucune charge opérationnelle de gestion du cycle de vie des DPU, car l'expérience vSphere de jour 0, jour 1 et jour 2 existante ne change pas. vSphere Distributed Services Engine est pris en charge par les DPU de NVIDIA et d'AMD, ainsi que par les conceptions de serveur Dell, HPE, Lenovo et Fujitsu. vSphere Distributed Services Engine est disponible sur les serveurs sur lesquels des DPU sont préinstallés.

À partir de vSphere 8.0, vous pouvez décharger la fonctionnalité qui s'exécute sur le CPU principal vers le DPU afin d'améliorer considérablement les performances réseau et de sécurité. Comme illustré dans le diagramme Architecture vSphere évolutive, les DPU peuvent également gérer des capacités supplémentaires telles que le déchargement de stockage et la gestion bare metal, mais ces capacités supplémentaires ne sont actuellement pas prises en charge.

Figure 1. Architecture vSphere évolutive.
VMware déplace la fonctionnalité qui s'exécute sur le complexe de CPU principal vers le complexe de CPU du DPU pour activer l'accélération du réseau.

vSphere Distributed Services Engine décharge et accélère les fonctions d'infrastructure sur le DPU en introduisant VMware vSphere Distributed Switch sur le DPU et la mise en réseau et l'observabilité de VMware NSX, ce qui vous permet de surveiller, d'identifier et d'atténuer de manière proactive les goulots d'étranglement de l'infrastructure réseau sans connexions réseau complexes. Le DPU devient un nouveau point de contrôle pour dimensionner les fonctions d'infrastructure et permet des contrôles de sécurité sans agent et dissociés du domaine de charge de travail.

Avec vSphere Distributed Services Engine, vous pouvez :

  • Installer et mettre à jour les images ESXi simultanément sur le serveur x86 et le DPU pris en charge attaché, afin de réduire la charge opérationnelle de la gestion du cycle de vie du DPU avec des workflows vSphere intégrés. Pour plus d'informations, reportez-vous à la section Utilisation de vSphere Lifecycle Manager avec VMware vSphere Distributed Services Engine.
  • Définir des alarmes pour les alertes matérielles de DPU et surveiller les mesures de performances sur le cœur, la mémoire et le débit réseau à partir des interfaces vCenter habituelles, sans avoir besoin de nouveaux outils. Pour plus d'informations, reportez-vous aux sections CPU (DPU) et Mémoire (DPU).
  • Accélérer vSphere Distributed Switch sur le DPU pour améliorer les performances du réseau et utiliser les cycles de CPU disponibles pour obtenir une meilleure consolidation de la charge de travail par hôte ESXi. Pour plus d'informations, reportez-vous aux sections Présentation de la capacité de déchargements réseau et Créer un vSphere Distributed Switch.
  • Obtenir la prise en charge de vSphere DRS et de vSphere vMotion pour les machines virtuelles s'exécutant sur des hôtes avec des DPU attachés afin de bénéficier des avantages du relais sans sacrifier la portabilité des machines virtuelles. Pour plus d'informations, reportez-vous à la section Clusters homogènes pour les DPU.
  • Améliorer la sécurité de l'infrastructure grâce à la sécurité Zero Trust. Pour plus d'informations, reportez-vous à la section Meilleures pratiques en matière de sécurité de vSphere Distributed Services Engine.

vSphere Distributed Services Engine ne nécessite pas de licence ESXi distincte. Un réseau interne isolé des autres réseaux connecte les DPU aux hôtes ESXi. Les builds de serveur ESXi 8.0 sont des images unifiées qui contiennent à la fois du contenu x86 et du contenu DPU. Dans votre système vSphere, vous voyez les DPU comme de nouveaux objets lors de l'installation et de la mise à niveau, ainsi que dans les workflows de mise en réseau, de stockage et de profil d'hôte.

Haute disponibilité avec VMware vSphere Distributed Services Engine

Avec ESXi 8.0 Update 3, vous pouvez opter pour une installation VMware vSphere Distributed Services Engine avec 2 unités de traitement des données (DPU) pour obtenir la haute disponibilité.

Dans les systèmes vSphere avec un seul DPU, le périphérique peut devenir le point unitaire de panne pour les charges de travail déchargées vers le DPU (telles que les fonctions de mise en réseau) et avoir un impact sur les données et la productivité. Avec ESXi 8.0 Update 3, vSphere Distributed Services Engine est également disponible sur les serveurs avec 2 DPU préinstallées, ce qui fournit la redondance et la résilience du matériel.

Vous pouvez utiliser les deux DPU en mode Actif/Veille pour fournir la haute disponibilité. Une telle configuration fournit la redondance en cas d'échec de l'un des DPU. Dans la configuration à haute disponibilité, les deux DPU sont attribués au même vSphere Distributed Switch reposant sur NSX. Par exemple, DPU-1 est attaché à vmnic0 et vmnic1 pour le vSphere Distributed Switch et DPU-2 est attaché à vmnic2 et vmnic3 du même vSphere Distributed Switch.

Vous pouvez également utiliser les deux DPU en tant que périphériques indépendants pour augmenter la capacité de déchargement par hôte ESXi. Chaque DPU est attaché à un vSphere Distributed Switch distinct et aucun basculement n'est possible entre les DPU dans cette configuration.

Les systèmes à double DPU peuvent utiliser des périphériques NVIDIA ou Pensando. Dans ESXi 8.0 Update 3, les systèmes à double DPU sont pris en charge par les conceptions de serveur Lenovo. Les périphériques DPU sur un serveur à double DPU doivent être identiques dans tous les aspects : même fournisseur, même version de matériel et même microprogramme. Pour obtenir la liste des fournisseurs et conceptions de serveur actuels pour VMware vSphere Distributed Services Engine, reportez-vous au Guide de compatibilité VMware.

Installation de VMware vSphere Distributed Services Engine avec 2 DPU

vSphere Distributed Services Engine ne nécessite pas de licence ESXi distincte. Les builds de serveur ESXi 8.0 Update 3 sont des images unifiées, qui contiennent du contenu x86 et DPU, et vous ne pouvez pas installer de contenu x86 et DPU séparément. La procédure d'installation sur les deux DPU, interactive ou scriptée, se produit également en parallèle et vous constatez une perte de performances minimale par rapport à un système à DPU unique.

Avec vSphere 8.0 Update 3, vous pouvez obtenir une configuration de serveur préinstallée avec 2 DPU depuis Dell ou Lenovo, ou ajouter un deuxième DPU à un système à DPU unique sur les serveurs à double DPU pris en charge depuis Dell ou Lenovo.
Note : Dans tous les cas, vous devez exécuter une nouvelle installation complète d'ESXi 8.0 Update 3 sur votre système, pas uniquement sur les DPU récemment ajoutés.

Pour plus d'informations sur l'installation, reportez-vous aux sections Installation de ESXi de façon interactive et Scripts d'installation et de mise à niveau utilisés pour l'installation d'ESXi.

Gestion des erreurs, basculement et restauration pour les VMware vSphere Distributed Services Engine

Avant d'installer VMware vSphere Distributed Services Engine, consultez les options de gestion des erreurs, de basculement et de restauration.

Traitement des erreurs

Un échec d'installation du contenu x86 et DPU sur un hôte ESXi marque l'intégralité de la procédure d'installation comme ayant échoué.

Bien qu'il soit prévu que l'état logiciel des DPU reste identique à tout moment, dans le cas peu probable d'une erreur lors d'une opération de cycle de vie (telle que l'installation ou la mise à niveau d'un composant), l'opération peut réussir sur un DPU, mais échouer sur l'autre. Étant donné que chaque opération de cycle de vie se produit dans les limites de chaque DPU, les erreurs n'affectent pas l'état de l'autre DPU, mais le résultat global de l'installation est toujours marqué comme un échec.

Lors de l'installation interactive, dans vSphere Lifecycle Manager workflows et lorsque vous utilisez ESXCLI, vous recevez des informations sur le DPU sur lequel l'opération a échoué.

Après une installation réussie, en cas d'erreurs DPU, l’action recommandée consiste à redémarrer l’hôte ESXi affecté. Si le DPU est toujours accessible depuis l'hôte, la collecte générale du bundle de journaux est suffisante pour le dépannage. Si le DPU n'est pas accessible depuis l'hôte, la connexion au DPU à partir d'une interface BMC, iLO ou iDRAC peut fournir des journaux de dépannage.

Basculement

La prise en charge du basculement dans vSphere 8.0 Update 3 est limitée à l'un des DPU qui ne fonctionne plus en raison d'erreurs logicielles dans le DPU ou d'une déconnexion physique de l'un des DPU, telle que la déconnexion du câble. Le basculement dû à des erreurs de niveau PCI (Peripheral Component Interconnect) n'est pas pris en charge.

Retour arrière

La restauration est un mécanisme de meilleur effort pour restaurer le système à un état de fonctionnement précédent en cas d'échec avant la phase de démarrage rapide du ESXi démarrage. La restauration sur les serveurs x86 et les DPU pris en charge attachés est automatique en cas d'erreur lors du démarrage. Vous pouvez également opter pour une restauration manuelle en appuyant sur Maj+R avant le lancement du chargeur de démarrage, pour revenir à un état correct précédent.

Tout échec après le démarrage rapide de la phase de démarrage rapide n'entraîne pas de restauration.

Tableau 1. Scénarios de restauration pour l'installation de VMware vSphere Distributed Services Engine
Scénario Nombre de redémarrages requis
Les deux DPU démarrent correctement. ESXi ne démarre pas correctement. 2
Les deux DPU ne démarrent pas correctement. ESXi démarre correctement. 1
L'un des DPU démarre avec une version antérieure à l'autre DPU et ESXi. 2
L'un des DPU démarre avec une version antérieure à l'autre DPU et ESXi ne démarre pas correctement. 2