VMware vSphere Bitfusion virtualise des accélérateurs matériels tels que les unités de traitement graphique (GPU) pour fournir un pool de ressources partagées et accessibles en réseau qui traitent les charges de travail d'intelligence artificielle (IA) et d'apprentissage automatique (ML).
Présentation de l'architecture de vSphere Bitfusion
vSphere Bitfusion dispose d'une architecture client-serveur. Le produit permet à plusieurs machines virtuelles (VM) clientes d'exécuter des applications d'intelligence artificielle (IA) et d'apprentissage automatique (ML) pour partager l'accès aux GPU distants sur des machines virtuelles exécutant le logiciel du serveur vSphere Bitfusion. Exécutez les applications sur les machines de client vSphere Bitfusion, tandis que les GPU qui assurent l'accélération sont installés sur les machines de serveur vSphere Bitfusion sur un réseau. Les applications peuvent ouvrir des fichiers, allouer de la mémoire et appeler CUDA comme s'ils fonctionnaient sur une machine avec des GPU locaux.
La figure suivante est un exemple d'un petit cluster vSphere Bitfusion, tel qu'un ensemble de machines client-serveur vSphere Bitfusion et vCenter Server sur un réseau commuté. Une configuration minimale de clusters vSphere Bitfusion est un client, un serveur et une instance de vCenter Server. Vous pouvez créer de grands clusters avec plusieurs serveur et plusieurs clients.
Fonctionnement de vSphere Bitfusion
Lorsque vous démarrez une application IA ou ML sur le client vSphere Bitfusion, vSphere Bitfusion intercepte les appels CUDA de l'application et voit les données et les pointeurs de données des appels. Le serveur vSphere Bitfusion n'a pas besoin d'une connexion au stockage, dans lequel les données d'application sont conservées, mais uniquement au client vSphere Bitfusion. Le client transfère les données et le reste des appels CUDA au serveur. Le serveur vSphere Bitfusion traite les appels et renvoie les résultats au client.
Lorsque vous démarrez des applications IA et ML dans vSphere Bitfusion, vous pouvez partager les ressources de GPU.
- Vous pouvez allouer dynamiquement des ressources GPU et y accéder à partir de serveurs vSphere Bitfusion.
Les applications peuvent partager des ressources GPU qui ne sont pas installées sur des machines locales et vous pouvez exécuter chaque application dans un environnement approprié sur un client vSphere Bitfusion configuré, tel qu'une machine virtuelle, une machine bare metal ou un conteneur. Les applications consomment les services d'accélération GPU d'un pool de serveurs vSphere Bitfusion sur un réseau, et consomment les ressources uniquement pendant la durée d'exécution d'une application ou d'une session. Les GPU reviennent au pool lorsque les applications ou les sessions sont terminées.
- Vous pouvez accéder aux partitions de ressources GPU pour un partage simultané avec d'autres applications.
La mémoire d'un GPU physique peut être divisée en fractions d'une taille arbitraire. Chaque fraction peut être allouée à une application différente en même temps. vSphere Bitfusion effectue le partage avec une technologie d'interposition. vSphere Bitfusion intercepte les appels d'API normalement adressés à un accélérateur local sur un bus hôte PCIe et envoie les appels d'API et les données associées sur un réseau. vSphere Bitfusion fournit des services de partage pour les applications IA et ML, et prend en charge l'API CUDA pour cibler les GPU NVIDIA.
Principaux composants de vSphere Bitfusion
- Qu'est-ce qu'un serveur vSphere Bitfusion ?
- Le serveur vSphere Bitfusion s'exécute sur un hôte ESXi disposant de GPU localement installés en tant que dispositif VMware, qui est une machine virtuelle (VM) préconfigurée avec des logiciels et des services prépackagés. Le serveur nécessite un accès aux GPU locaux, généralement via VMware vSphere ® DirectPath I/O™.
- Qu'est-ce qu'un client vSphere Bitfusion ?
- Un client vSphere Bitfusion s'exécute sur des machines virtuelles qui exécutent des applications IA et ML.
- Qu'est-ce qu'un plug-in vSphere Bitfusion ?
- Les serveurs vSphere Bitfusion enregistrent un plug-in vSphere Bitfusion dans VMware vCenter Server. Le plug-in assure la surveillance et la gestion des clients et des serveurs vSphere Bitfusion.
- Qu'est-ce qu'un cluster vSphere Bitfusion ?
- Le cluster vSphere Bitfusion est l'ensemble de tous les serveurs et clients vSphere Bitfusion d'une instance de vCenter Server.
- Qu'est-ce qu'un groupe d'utilisateurs Linux vSphere Bitfusion ?
-
Pendant le processus d'installation d'un client
vSphere Bitfusion, le client crée un groupe d'utilisateurs Linux
vSphere Bitfusion,
bitfusion
. Seuls les membres du groupe peuvent utiliser vSphere Bitfusion. Certains fichiers de configuration sont configurés avec des autorisations appropriées et les membres du groupe héritent des limites appropriées pour fonctionner efficacement avec vSphere Bitfusion. - Qu'est-ce qu'un vSphere Client ?
- vSphere Client vous permet de vous connecter aux instances de vCenter Server à l'aide d'un navigateur Web pour y gérer votre infrastructure vSphere. Vous accédez au plug-in vSphere Bitfusion via vSphere Client.
- Qu'est-ce qu'une interface de ligne de commande (CLI) ?
- Vous pouvez gérer des serveurs et des clients vSphere Bitfusion à l'aide de commandes d'interface de ligne de commande (CLI).
- Qu'est-ce qu'un système vCenter Server ?
- vCenter Server est le logiciel de gestion de serveur qui fournit une plate-forme centralisée pour contrôler votre environnement vSphere.
FAQ de vSphere Bitfusion
Pour en savoir plus sur vSphere Bitfusion, consultez Questions fréquemment posées (FAQ) dans La zone technique de Cloud Platform.