Compute Unified Device Architecture (CUDA) est une plate-forme informatique parallèle et un modèle de programmation développé par NVIDIA pour une utilisation générale sur les unités de traitement graphique (GPU). CUDA accélère considérablement les applications informatiques en utilisant la puissance de traitement des GPU. Par exemple, CUDA est utilisé par les évaluations TensorFlow et PyTorch.

Installation de NVIDIA CUDA sous Ubuntu

Pour exécuter des workflows d'intelligence artificielle et d'apprentissage automatique dans vSphere Bitfusion, vous devez installer CUDA sur le système d'exploitation Ubuntu Linux de votre client vSphere Bitfusion.

Conditions préalables

Vérifiez que vous avez installé le client vSphere Bitfusion sur un système d'exploitation Ubuntu Linux.

Procédure

  1. Accédez à un répertoire sur la machine virtuelle dans laquelle vous souhaitez télécharger la distribution NVIDIA CUDA.
    cd <download_directory>
  2. Téléchargez et déplacez le fichier cuda-ubuntu2004.pin.
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. Téléchargez la distribution NVIDIA CUDA pour votre Ubuntu 20.04 à l'aide de la commande wget.
    wget <https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb>
  4. Installez le module CUDA 11 pour Ubuntu 20.04 à l'aide de la commande dpkg -i.
    sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  5. Installez les clés pour authentifier le module logiciel à l'aide de la commande apt-key.
    La commande apt-key gère la liste des clés utilisées par apt pour authentifier les modules. Les modules qui ont été authentifiés à l'aide de ces clés sont considérés comme fiables.
    sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
  6. Mettez à jour et installez le module logiciel CUDA.
    sudo apt-get update
    sudo apt-get install cuda
  7. (Facultatif) Pour confirmer la taille de la partition GPU ou pour vérifier les ressources disponibles sur votre déploiement vSphere Bitfusion, exécutez l'application de surveillance (nvidia-smi) de l'interface de gestion du système NVIDIA.
    bitfusion run -n 1 nvidia-smi
  8. Accédez au répertoire contenant les exemples de fichiers de multiplication de matrice CUDA (matrixMul).
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  9. Exécutez les commandes make et bitfusion run sur l'exemple de fichier matrixMul.
    sudo make
    bitfusion run -n 1 ./matrixMul

Que faire ensuite

Installez et configurez NVIDIA cuDNN. Reportez-vous à la section Installation de NVIDIA cuDNN dans vSphere Bitfusion.

Installer NVIDIA CUDA sur CentOS ou Red Hat Linux

Pour exécuter des workflows d'intelligence artificielle et d'apprentissage automatique dans vSphere Bitfusion , vous devez installer CUDA sur le système d'exploitation CentOS ou Red Hat Linux de votre client vSphere Bitfusion.

Conditions préalables

Vérifiez que vous avez installé le client vSphere Bitfusion sur un système d'exploitation CentOS ou Red Hat Linux.

Procédure

  1. Sur la machine virtuelle, accédez au répertoire dans lequel vous souhaitez télécharger la distribution NVIDIA CUDA.
    cd <download_directory>
  2. Pour télécharger le module NVIDIA CUDA 11 pour CentOS 8 ou Red Hat Linux 8, exécutez la commande wget.
    wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  3. Pour installer le module CUDA, exécutez la commande rpm -i.
    sudo rpm -i cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  4. Exécutez les commandes yum clean all et yum -y install comme indiqué pour mettre à jour votre environnement et installer le module logiciel CUDA.
    sudo yum clean all
    sudo yum -y install cuda
  5. (Facultatif) Pour confirmer la taille de la partition GPU ou pour vérifier les ressources disponibles sur votre déploiement vSphere Bitfusion, exécutez l'application de surveillance (nvidia-smi) de l'interface de gestion du système NVIDIA.
    bitfusion run -n 1 nvidia-smi
  6. Accédez au répertoire contenant les exemples de fichiers de multiplication de matrice CUDA (matrixMul).
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  7. Exécutez les commandes make et bitfusion run sur l'exemple de fichier matrixMul.
    sudo make
    bitfusion run -n 1 ./matrixMul

Que faire ensuite

Installez et configurez NVIDIA cuDNN. Reportez-vous à la section Installation de NVIDIA cuDNN dans vSphere Bitfusion.