Déployer une VM à apprentissage profond directement sur un cluster vSphere de VMware Private AI Foundation with NVIDIA

Pour tester rapidement les modèles de VM à apprentissage profond dans VMware Private AI Foundation with NVIDIA, vous pouvez déployer une VM à apprentissage profond directement sur un cluster vSphere à l'aide de vSphere Client.

Conditions préalables

Vérifiez que les conditions préalables suivantes sont en place pour l'infrastructure prête pour l'IA.

VMware Private AI Foundation with NVIDIA est déployé et configuré. Reportez-vous à la section Déploiement de VMware Private AI Foundation with NVIDIA.
Une bibliothèque de contenu avec des VM à apprentissage profond est disponible. Reportez-vous à la section Créer une bibliothèque de contenu avec des images de VM à apprentissage profond pour VMware Private AI Foundation with NVIDIA.

Procédure

Connectez-vous à l'instance de vCenter Server pour le domaine de charge de travail VI.
Dans le menu d'accueil de vSphere Client, sélectionnez Bibliothèques de contenu.
Déployez une VM à apprentissage profond à partir de la bibliothèque de contenu.
1. Accédez à l'image de VM à apprentissage profond dans la bibliothèque de contenu.
2. Cliquez avec le bouton droit sur un modèle OVF et sélectionnez Nouvelle VM à partir de ce modèle.
3. Suivez l'assistant pour entrer un nom et sélectionnez un dossier de VM, puis un cluster avec GPU activé dans le domaine de charge de travail VI.
4. Sélectionnez une banque de données et un réseau sur le commutateur Distributed Switch pour le cluster.
5. Sur la page Personnaliser le modèle, entrez les propriétés de VM personnalisées requises pour configurer la fonctionnalité d'IA.
  Reportez-vous à la section Propriétés OVF des VM à apprentissage profond.
6. Cliquez sur Terminer.
Une fois la VM à apprentissage profond créée, attribuez-lui un périphérique NVIDIA vGPU dans les paramètres de la machine virtuelle.
Reportez-vous à la section Ajouter un dispositif NVIDIA GRID vGPU à une machine virtuelle.
Pour une VM à apprentissage profond qui exécute un dispositif NVIDIA RAG, sélectionnez le profil vGPU complet pour le mode de découpage temporel ou un profil MIG. Par exemple, pour le dispositif NVIDIA A100 40 Go en mode de découpage temporel vGPU, sélectionnez nvidia_a100-40c.
Pour une VM à apprentissage profond qui exécute un dispositif NVIDIA RAG, définissez le paramètre pciPassthru<vgpu-id>.cfg.enable_uvm sur 1 dans l'onglet Paramètres avancés des paramètres de la machine virtuelle.

où <vgpu-id> identifie le vGPU attribué à la machine virtuelle. Par exemple, si deux vGPU sont attribués à la machine virtuelle, définissez pciPassthru0.cfg.parameter=1 et pciPassthru1.cfg.parameter = 1.
Mettez sous tension la VM à apprentissage profond.

Résultats

Le pilote invité vGPU et la charge de travail d'apprentissage profond spécifiée sont installés lorsque vous démarrez la VM à apprentissage profond.

Vous pouvez examiner les journaux ou ouvrir l'instance de JupyterLab fournie avec certaines images. Vous pouvez partager les détails de l'accès avec des scientifiques des données de votre organisation. Reportez-vous à la section Charges de travail d'apprentissage profond dans VMware Private AI Foundation with NVIDIA.

Que faire ensuite

Connectez-vous à la VM à apprentissage profond via SSH et vérifiez que tous les composants sont installés et en cours d'exécution comme prévu.
Envoyez les détails d'accès à vos scientifiques des données.