vSphere Distributed Services Engine® ist eine Kernfunktion von vSphere, mit der Kunden DPUs mit vSphere und VMware Cloud Foundation verwenden können.

vSphere 8.0 ermöglicht eine hervorragende Arbeitslastleistung, die den ständig wachsenden Anforderungen an Durchsatz und Latenz gerecht wird. Mit vSphere Distributed Services Engine werden Infrastrukturdienste auf die verschiedenen auf dem ESXi-Host verfügbaren Computing-Ressourcen verteilt und Netzwerkfunktionen an die DPU ausgelagert. Eine solche Fähigkeit eignet sich gut für moderne Anwendungen, die mit einem Microservices-Architekturansatz entwickelt werden. Ziel ist es dabei, die Anwendung in mehrere unabhängige, aber kooperierende Dienste aufzuteilen. Diese erhöhte Komplexität stellt neue Anforderungen an die CPU. Durch das Verarbeiten von Speicheranforderungen oder Abwickeln des Netzwerkdatenverkehrs für diese Microservices verbleiben beispielsweise weniger CPU-Zyklen für die eigentliche Arbeitslast. In diesem Zusammenhang können speziell entwickelte Beschleuniger wie DPUs die neue Rechenlast übernehmen und Ihnen dabei helfen, die Leistung und Effizienz der Infrastruktur zu verbessern.

Mit vSphere Distributed Services Engine können DPUs die Leistung Ihres Netzwerks beschleunigen und den Datendurchsatz erhöhen. Die Verwaltung des Lebenszyklus von DPUs stellt dabei keine operative Belastung dar, da sich die bestehende Tag-0-, Tag-1- und Tag-2-vSphere-Erfahrung nicht ändert. vSphere Distributed Services Engine wird von DPUs der Anbieter NVIDIA und AMD sowie von Serverdesigns der Anbieter Dell, HPE, Lenovo und Fujitsu unterstützt. vSphere Distributed Services Engine ist auf Servern mit vorinstallierten DPUs verfügbar.

Ab vSphere 8.0 können Sie Funktionen, die auf der Kern-CPU ausgeführt werden, auf die DPU auslagern, um die Netzwerk- und Sicherheitsleistung erheblich zu verbessern. Wie im Diagramm „Entwicklung der vSphere-Architektur“ dargestellt, können DPUs auch zusätzliche Funktionen wie Speicherauslagerung und Bare Metal-Verwaltung verarbeiten, aber diese zusätzlichen Funktionen werden derzeit nicht unterstützt.

Abbildung 1. Entwicklung der vSphere-Architektur.
VMware verschiebt Funktionen, die auf dem Kern-CPU-Komplex ausgeführt werden, in den DPU-CPU-Komplex, um die Netzwerkbeschleunigung zu ermöglichen.

vSphere Distributed Services Engine lagert Infrastrukturfunktionen an die DPU aus und beschleunigt die Funktionen durch Einführung eines VMware vSphere Distributed Switch auf der DPU sowie von VMware NSX Networking and Observability. Damit können Sie Engpässe in der Netzwerkinfrastruktur ohne komplexe Netzwerk-Taps proaktiv überwachen, identifizieren und entschärfen. Die DPU wird zu einem neuen Kontrollpunkt für die Skalierung von Infrastrukturfunktionen und ermöglicht Sicherheitskontrollen, die agentlos und von der Arbeitslastdomäne entkoppelt sind.

Mit vSphere Distributed Services Engine haben Sie folgende Möglichkeiten:

  • Installieren und Aktualisieren von ESXi-Images auf dem x86-Server und der angehängten unterstützten DPU gleichzeitig, um den betrieblichen Overhead der DPU-Lebenszyklusverwaltung mit integrierten vSphere-Workflows zu reduzieren. Weitere Informationen finden Sie unter Using vSphere Lifecycle Manager With VMware vSphere Distributed Services Engine.
  • Festlegen von Alarmen für DPU-Hardwarewarnungen und Überwachen der Leistungsmetriken zu Kern-, Arbeitsspeicher- und Netzwerkdurchsatz ausgehend von den vertrauten vCenter-Schnittstellen, ohne dass neue Tools benötigt werden. Weitere Informationen finden Sie unter CPU (DPU) und Memory (DPU).
  • Beschleunigen von vSphere Distributed Switch auf der DPU, um die Netzwerkleistung zu verbessern und verfügbare CPU-Zyklen zu nutzen, sodass eine höhere Arbeitslastkonsolidierung pro ESXi-Host erreicht wird. Weitere Informationen finden Sie unter What is Network Offloads Capability und Create a vSphere Distributed Switch.
  • Profitieren von vSphere DRS- und vSphere vMotion-Unterstützung für VMs, die auf Hosts mit angeschlossenen DPUs ausgeführt werden, um die Passthrough-Vorteile zu nutzen, ohne die VM-Portabilität zu beeinträchtigen. Weitere Informationen finden Sie unter Homogenous clusters for DPUs.
  • Verbessern der Infrastruktursicherheit mit Zero-Trust-Sicherheit. Weitere Informationen finden Sie unter vSphere Distributed Services Engine Security Best Practices.

vSphere Distributed Services Engine benötigt keine separate ESXi-Lizenz. Ein internes Netzwerk, das von anderen Netzwerken isoliert ist, verbindet die DPUs mit ESXi-Hosts. Server-Builds von ESXi 8.0 sind einheitliche Images, die sowohl x86- als auch DPU-Inhalte enthalten. In Ihrem vSphere-System werden DPUs bei Installation und Upgrade sowie in Netzwerk-, Speicher- und Hostprofil-Workflows als neue Objekte angezeigt.

Hochverfügbarkeit mit VMware vSphere Distributed Services Engine

Mit ESXi 8.0 Update 3 können Sie sich für eine VMware vSphere Distributed Services Engine-Installation mit 2 Datenverarbeitungseinheiten (DPUs) entscheiden, um Hochverfügbarkeit zu erreichen.

In vSphere-Systemen mit einer einzelnen DPU wird das Gerät möglicherweise zur einzelnen Fehlerquelle für Arbeitslasten, die an die DPU ausgelagert werden, wie z. B. Netzwerkfunktionen, was sich auf Daten und Produktivität auswirken kann. Mit ESXi 8.0 Update 3 ist vSphere Distributed Services Engine auch auf Servern mit 2 vorinstallierten DPUs verfügbar, was Hardwareredundanz und Belastbarkeit bietet.

Sie können die beiden DPUs im Aktiv/Standby-Modus verwenden, um Hochverfügbarkeit bereitzustellen. Eine solche Konfiguration bietet Redundanz für den Fall, dass eine der DPUs ausfällt. In der Hochverfügbarkeitskonfiguration werden beide DPUs demselben NSX-gestützten vSphere Distributed Switch zugewiesen. Beispielsweise ist DPU-1 an vmnic0 und vmnic1 des vSphere Distributed Switch und DPU-2 an vmnic2 und vmnic3 desselben vSphere Distributed Switch angehängt.

Sie können die beiden DPUs auch als unabhängige Geräte verwenden, um die Auslagerungskapazität pro ESXi Host zu erhöhen. Jede DPU ist an einen separaten vSphere Distributed Switch angehängt, und es gibt kein Failover zwischen DPUs in einer solchen Konfiguration.

Systeme mit zwei DPUs können NVIDIA- oder Pensando-Geräte verwenden. In ESXi 8.0 Update 3 werden Systeme mit zwei DPUs von Lenovo-Serverdesigns unterstützt. Die DPU-Geräte auf einem Server mit zwei DPUs müssen in allen Aspekten identisch sein: gleicher Anbieter, gleiche Hardwareversion und gleiche Firmware. Eine Liste der aktuellen Anbieter und Serverdesigns für VMware vSphere Distributed Services Engine finden Sie im VMware-Kompatibilitätshandbuch.

Installation von VMware vSphere Distributed Services Engine mit 2 DPUs

vSphere Distributed Services Engine benötigt keine separate ESXi-Lizenz. ESXi 8.0 Update 3-Server-Builds sind vereinheitlichte Images, die sowohl x86- als auch DPU-Inhalte enthalten. Sie können x86- und DPU-Inhalte nicht separat installieren. Der Installationsvorgang auf beiden DPUs, entweder interaktiv oder skriptbasiert, erfolgt ebenfalls parallel, und im Vergleich zu einem System mit einer DPU kommt es zu minimalen Leistungseinbußen.

Mit vSphere 8.0 Update 3 können Sie eine vorinstallierte Serverkonfiguration mit 2 DPUs von Dell oder Lenovo erhalten oder eine zweite DPU zu einem System mit einer DPU auf den unterstützten Servern für zwei DPUs von Dell oder Lenovo hinzufügen.
Hinweis: In jedem Fall müssen Sie eine vollständige neue ESXi 8.0 Update 3-Installation auf Ihrem System ausführen, nicht nur auf den neu hinzugefügten DPUs.

Weitere Informationen zur Installation finden Sie unter Interaktives Installieren von ESXi und Installations- und Upgrade-Skripts, die für ESXi-Installation verwendet werden.

Fehlerbehandlung, Failover und Rollback für VMware vSphere Distributed Services Engine

Bevor Sie VMware vSphere Distributed Services Engine installieren, informieren Sie sich über die Optionen zur Fehlerbehandlung, zum Failover und zum Rollback.

Fehlerbehandlung

Ein Installationsfehler von x86- und DPU-Inhalten auf einem ESXi-Host kennzeichnet den gesamten Installationsvorgang als fehlgeschlagen.

Es ist zwar davon auszugehen, dass der Softwarestatus der DPUs jederzeit identisch ist, aber im unwahrscheinlichen Fall eines Fehlers während eines Lebenszyklusvorgangs, z. B. bei der Installation oder Aktualisierung einer Komponente, könnte der Vorgang bei einer DPU erfolgreich sein, bei der anderen jedoch fehlschlagen. Da jeder Lebenszyklusvorgang innerhalb der Grenzen der einzelnen DPUs stattfindet, wirken sich Fehler nicht auf den Zustand der anderen DPUs aus, aber das Gesamtergebnis der Installation wird dennoch als Fehlschlag angegeben.

Während der interaktiven Installation, in vSphere Lifecycle Manager-Workflows und bei Verwendung von ESXCLI erhalten Sie Informationen über die DPU, bei der der Vorgang fehlgeschlagen ist.

Nach einer erfolgreichen Installation wird bei DPU-Fehlern empfohlen, den betroffenen ESXi-Host neu zu starten. Wenn die DPU weiterhin vom Host aus zugänglich ist, reicht die allgemeine Protokollpaketerfassung für die Fehlerbehebung aus. Wenn der Host nicht auf die DPU zugreifen kann, können bei der Anmeldung bei der DPU über eine BMC-, iLO- oder iDRAC-Schnittstelle Fehlerbehebungsprotokolle bereitgestellt werden.

Failover

Die Failover-Unterstützung in vSphere 8.0 Update 3 ist auf den Fall beschränkt, dass eine der DPUs aufgrund von Softwarefehlern innerhalb der DPU oder einer physischen Unterbrechung einer der DPUs, z. B. einer Kabelunterbrechung, nicht mehr funktionsfähig ist. Failovers aufgrund von Fehlern auf PCI-FehlernEbene (Peripheral Component Interconnect) werden nicht unterstützt.

Rollback

Ein Rollback ist ein Best-Effort-Mechanismus, mit dem das System im Falle eines Fehlers vor der Jumpstart-Phase des ESXi-Boots in einen früheren Arbeitszustand zurückversetzt wird. Ein Rollback auf x86-Servern und den angeschlossenen unterstützten DPUs erfolgt automatisch im Falle eines Fehlers beim Booten. Sie können sich auch für ein manuelles Rollback entscheiden, indem Sie Umschalt+R drücken, bevor der Bootloader gestartet wird, um zu einem früheren guten Zustand zurückzukehren.

Ein Fehler nach dem Start der Jumpstart-Phase führt nicht zu einem Rollback.

Tabelle 1. Rollback-Szenarien für VMware vSphere Distributed Services Engine-Installationen
Szenario Anzahl der erforderlichen Neustarts
Beide DPUs werden ordnungsgemäß gestartet. ESXi wird nicht ordnungsgemäß gestartet. 2
Beide DPUs werden nicht ordnungsgemäß gestartet. ESXi wird ordnungsgemäß gestartet. 1
Eine der DPUs wird mit einer älteren Version als die andere DPU und ESXi gestartet. 2
Eine der DPUs wird mit einer älteren Version als die andere DPU gestartet, und ESXi wird nicht ordnungsgemäß gestartet. 2