Pour tester rapidement les modèles de VM à apprentissage profond dans VMware Private AI Foundation with NVIDIA, vous pouvez déployer une VM à apprentissage profond directement sur un cluster vSphere à l'aide de vSphere Client.

Conditions préalables

Vérifiez que les conditions préalables suivantes sont en place pour l'infrastructure prête pour l'IA.

Procédure

  1. Connectez-vous à l'instance de vCenter Server pour le domaine de charge de travail VI.
  2. Dans le menu d'accueil de vSphere Client, sélectionnez Bibliothèques de contenu.
  3. Déployez une VM à apprentissage profond à partir de la bibliothèque de contenu.
    1. Accédez à l'image de VM à apprentissage profond dans la bibliothèque de contenu.
    2. Cliquez avec le bouton droit sur un modèle OVF et sélectionnez Nouvelle VM à partir de ce modèle.
    3. Suivez l'assistant pour entrer un nom et sélectionnez un dossier de VM, puis un cluster avec GPU activé dans le domaine de charge de travail VI.
    4. Sélectionnez une banque de données et un réseau sur le commutateur Distributed Switch pour le cluster.
    5. Sur la page Personnaliser le modèle, entrez les propriétés de VM personnalisées requises pour configurer la fonctionnalité d'IA.
    6. Cliquez sur Terminer.
  4. Une fois la VM à apprentissage profond créée, attribuez-lui un périphérique NVIDIA vGPU dans les paramètres de la machine virtuelle.
    Reportez-vous à la section Ajouter un dispositif NVIDIA GRID vGPU à une machine virtuelle.

    Pour une VM à apprentissage profond qui exécute un dispositif NVIDIA RAG, sélectionnez le profil vGPU complet pour le mode de découpage temporel ou un profil MIG. Par exemple, pour le dispositif NVIDIA A100 40 Go en mode de découpage temporel vGPU, sélectionnez nvidia_a100-40c.

  5. Pour une VM à apprentissage profond qui exécute un dispositif NVIDIA RAG, définissez le paramètre pciPassthru<vgpu-id>.cfg.enable_uvm sur 1 dans l'onglet Paramètres avancés des paramètres de la machine virtuelle.

    <vgpu-id> identifie le vGPU attribué à la machine virtuelle. Par exemple, si deux vGPU sont attribués à la machine virtuelle, définissez pciPassthru0.cfg.parameter=1 et pciPassthru1.cfg.parameter = 1.

  6. Mettez sous tension la VM à apprentissage profond.

Résultats

Le pilote invité vGPU et la charge de travail d'apprentissage profond spécifiée sont installés lorsque vous démarrez la VM à apprentissage profond.

Vous pouvez examiner les journaux ou ouvrir l'instance de JupyterLab fournie avec certaines images. Vous pouvez partager les détails de l'accès avec des scientifiques des données de votre organisation. Reportez-vous à la section Charges de travail d'apprentissage profond dans VMware Private AI Foundation with NVIDIA.

Que faire ensuite

  • Connectez-vous à la VM à apprentissage profond via SSH et vérifiez que tous les composants sont installés et en cours d'exécution comme prévu.
  • Envoyez les détails d'accès à vos scientifiques des données.