Les images VMware Deep Learning VM sont fournies dans le cadre de VMware Private AI Foundation with NVIDIA. Elles sont préconfigurées avec les charges de travail ML populaires, et sont optimisées et validées par NVIDIA et VMware pour l'accélération GPU dans un environnement VMware Cloud Foundation.

VMware Deep Learning VM 1.1 | 23 juillet 2024

Recherchez des ajouts et des mises à jour pour ces notes de mise à jour.

Bibliothèque de contenu

Les images de VM à apprentissage profond sont fournies comme modèles de VM vSphere, hébergées et publiées par VMware dans une bibliothèque de contenu. Vous pouvez utiliser ces images pour déployer une VM à apprentissage profond à l'aide de vSphere Client ou de VMware Aria Automation.

La bibliothèque de contenu avec des images de VM à apprentissage profond pour VMware Private AI Foundation with NVIDIA est disponible sur l'URL https://packages.vmware.com/dl-vm/lib.json. Dans un environnement connecté, créez une bibliothèque de contenu abonnée connectée à cette URL et, dans un environnement déconnecté, une bibliothèque de contenu locale dans laquelle vous chargez des images à partir de la bibliothèque de contenu centrale.

Compatibilité et mise à niveau

Utilisez la dernière version de VMware Deep Learning VM si votre environnement la prend en charge.

La mise à jour d'une VM à apprentissage profond vers une image ultérieure n'est pas prise en charge. Vous devez déployer une nouvelle machine virtuelle à apprentissage profond à l'aide d'une version ultérieure d'image de VM à apprentissage profond.

Installation

Déployez une image de VM à apprentissage profond à partir d'une bibliothèque de contenu sur l'instance de vCenter Server pour le domaine de charge de travail VI compatible avec l'IA. Vous pouvez déployer une VM à apprentissage profond sur les systèmes suivants :

  • En tant que scientifique des données ou ingénieur DevOps

    • Sur un superviseur dans le plan de contrôle vSphere IaaS à l'aide de VMware Aria Automation.

  • En tant qu'administrateur de cloud

    • Directement sur un cluster vSphere

  • En tant qu'ingénieur DevOps

    • Sur un superviseur dans le plan de contrôle vSphere IaaS à l'aide de kubectl.

Reportez-vous à la section Déploiement d'une VM à apprentissage profond dans VMware Private AI Foundation with NVIDIA.

VMware Deep Learning VM 1.1

Snapshot d'image

VMware Deep Learning VM 1.1 peut être utilisé avec VMware Cloud Foundation 5.2.

Snapshot

Date de publication

Version de VMware Cloud Foundation compatible

common-container-nv-vgpu-ubuntu-2204-v20240613

23 juillet 2024

VMware Cloud Foundation 5.2

Nouveautés

  • L'image de la VM à apprentissage profond intègre désormais une installation Miniconda.

  • L'image de la VM à apprentissage profond contient désormais un manifeste de l'environnement Conda pour PyTorch vérifié.

  • Vous pouvez utiliser le paramètre OVF Conda Environment Install pour spécifier une liste séparée par des virgules d'environnements Conda à installer automatiquement lors du déploiement de VM. Actuellement, vous pouvez installer un environnement pytorch2.3_py3.12.

  • Des journaux plus détaillés sur le script d'initialisation sont disponibles dans /var/log/vgpu-install.log.

Périphériques GPU NVIDIA pris en charge

VMware Deep Learning VM 1.1 prend en charge les GPU suivants sur vos hôtes ESXi :

Composant NVIDIA

Option prise en charge

GPU NVIDIA

  • NVIDIA A100

  • NVIDIA L40S

  • NVIDIA H100

Mode de partage de GPU

  • Découpage temporel

  • GPU à plusieurs instances

Composants de VMware Deep Learning VM 1.1

Cette version de l'image de machine virtuelle à apprentissage profond contient les logiciels suivants :

Catégorie de composant logiciel

Composant logiciel

Version

Intégrée

Canonical Ubuntu

22.04

NVIDIA Container Toolkit

1.15.0

Docker Community Engine

26.0.2

Miniconda

24.3.0-0 (Python 3.12)

Peut être préinstallé automatiquement

Pilote invité NVIDIA vGPU

Selon la version du pilote d'hôte NVIDIA vGPU

Environnement Conda pour PyTorch

2.3.0 (Python 3.12)

Charge de travail d'apprentissage profond (DL) à partir de NVIDIA NGC

Exemple CUDA

-

PyTorch

-

TensorFlow

-

Exportateur DCGM

-

Serveur d'inférence Triton

-

NVIDIA RAG

-

Problèmes résolus

  • Les versions antérieures du pilote NVIDIA vGPU ne sont pas téléchargées à partir du portail de licences NVIDIA.

  • L'état de GuestBootstrap s'affiche de manière incorrecte dans certains cas.

  • Le téléchargement du pilote NVIDIA vGPU peut échouer en raison de problèmes réseau.

  • Le fichier SSH authorized_keys utilisé lors du processus de création d'images, est disponible dans le répertoire ~/.ssh/.

VMware Deep Learning VM 1.0.1

Snapshot d'image

VMware Deep Learning VM 1.0.1 peut être utilisé avec VMware Cloud Foundation 5.1.1.

Snapshot

Date de publication

Version de VMware Cloud Foundation compatible

common-container-nv-vgpu-ubuntu-2204-v20240419

6 mai 2024

VMware Cloud Foundation 5.1.1

Nouveautés

  • Les versions de NVIDIA Container Toolkit et de Docker Community Engine sont mises à jour.

  • La description des propriétés OVF affichées lors du déploiement d'une VM à apprentissage profond à l'aide de l'assistant de déploiement OVF est améliorée.

  • Le format d'URL de téléchargement des pilotes invités vGPU pour les environnements déconnectés prend désormais en charge les listes d'index d'annuaires, telles que générées par les serveurs Web, tels que NGINX ou Apache HTTP Server.

  • Un lien d'accès à la documentation de VMware Deep Learning VM s'affiche sous la forme d'un « message du jour » dans le système d'exploitation Ubuntu.

Périphériques GPU NVIDIA pris en charge

VMware Deep Learning VM 1.0.1 prend en charge les GPU suivants sur vos hôtes ESXi :

Composant NVIDIA

Option prise en charge

GPU NVIDIA

  • NVIDIA A100

  • NVIDIA L40S

  • NVIDIA H100

Mode de partage de GPU

  • Découpage temporel

  • GPU à plusieurs instances

Composants de VMware Deep Learning VM 1.0.1

Cette version de l'image de machine virtuelle à apprentissage profond contient les logiciels suivants :

Catégorie de composant logiciel

Composant logiciel

Version

Intégrée

Canonical Ubuntu

22.04

NVIDIA Container Toolkit

1.15.0

Docker Community Engine

26.0.2

Peut être préinstallé automatiquement

Pilote invité NVIDIA vGPU

Selon la version du pilote d'hôte NVIDIA vGPU

Charge de travail d'apprentissage profond (DL) à partir de NVIDIA NGC

Exemple CUDA

-

PyTorch

-

TensorFlow

-

Exportateur DCGM

-

Serveur d'inférence Triton

-

NVIDIA RAG

-

Problèmes résolus

  • Impossible de se connecter à un registre de conteneur privé Docker si le mot de passe de registre défini dans les propriétés OVF de la VM à apprentissage profond contient des caractères spéciaux, tels que & < > " '.

  • Les propriétés OVF d'un registre de conteneur secondaire ne sont pas traitées.

  • L'exécution de apt update échoue en raison d'erreurs et d'avertissements de sécurité.

  • L'état d'exécution du script get-vgpu-driver.sh exécuté au démarrage de la VM, ne s'applique dans le paramètre guestinfo.vmservice.bootstrap.condition de VM Tools.

VMware Deep Learning VM 1.0

Snapshot d'image

VMware Deep Learning VM 1.0 peut être utilisé avec VMware Cloud Foundation 5.1.1.

Snapshot

Date de publication

Version de VMware Cloud Foundation compatible

common-container-nv-vgpu-ubuntu-2204-v20240217

26 mars 2024

VMware Cloud Foundation 5.1.1

Périphériques GPU NVIDIA pris en charge

VMware Deep Learning VM 1.0 prend en charge les GPU suivants sur vos hôtes ESXi :

Composant NVIDIA

Option prise en charge

GPU NVIDIA

  • NVIDIA A100

  • NVIDIA L40S

  • NVIDIA H100

Mode de partage de GPU

  • Découpage temporel

  • GPU à plusieurs instances

Composants de VMware Deep Learning VM 1.0

La version initiale de l'image de machine virtuelle à apprentissage profond contient les logiciels suivants :

Catégorie de composant logiciel

Composant logiciel

Version

Intégrée

Canonical Ubuntu

22.04

NVIDIA Container Toolkit

1.13.5

Docker Community Engine

25.03

Peut être préinstallé automatiquement

Pilote invité NVIDIA vGPU

Selon la version du pilote d'hôte NVIDIA vGPU

Charge de travail d'apprentissage profond (DL) à partir de NVIDIA NGC

Exemple CUDA

-

PyTorch

-

TensorFlow

-

Exportateur DCGM

-

Serveur d'inférence Triton

-

NVIDIA RAG

-

Informations sur les licences

Les versions de VMware Deep Learning VM sont disponibles avec une licence VMware Private AI Foundation with NVIDIA. Reportez-vous au Guide de VMware Private AI Foundation with NVIDIA.

Documentation

Consultez le Guide de VMware Private AI Foundation with NVIDIA pour obtenir une présentation et des instructions d'utilisation pour l'exécution de VM à apprentissage profond dans un environnement VMware Cloud Foundation.

check-circle-line exclamation-circle-line close-line
Scroll to top icon