Bei CUDA (Compute Unified Device Architecture) handelt es sich um eine parallele Computing-Plattform und ein Programmiermodell, die von NVIDIA für allgemeine Berechnungen auf Grafikprozessoren (GPUs) entwickelt wurden. Computing-Anwendungen werden von CUDA mithilfe der Verarbeitungsleistung von GPUs erheblich beschleunigt. CUDA wird beispielsweise von TensorFlow- und PyTorch-Benchmarks verwendet.

Installieren von NVIDIA CUDA unter Ubuntu

Zum Ausführen von KI- und ML-Workflows in vSphere Bitfusion müssen Sie CUDA auf dem Ubuntu Linux-Betriebssystem Ihres vSphere Bitfusion-Clients installieren.

Voraussetzungen

Stellen Sie sicher, dass der vSphere Bitfusion-Client auf einem Ubuntu Linux-Betriebssystem installiert ist.

Prozedur

  1. Navigieren Sie zu einem Verzeichnis auf der virtuellen Maschine, in das die NVIDIA CUDA-Distribution heruntergeladen werden soll.
    cd <download_directory>
  2. Laden Sie die Datei cudo-ubuntu2004.pin herunter und verschieben Sie sie.
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. Laden Sie die NVIDIA CUDA-Distribution für Ubuntu 20.04 mithilfe des Befehls wget herunter.
    wget <https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb>
  4. Installieren Sie das CUDA 11-Paket für Ubuntu 20.04 mithilfe des Befehls dpkg -i.
    sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  5. Installieren Sie die Schlüssel, um das Softwarepaket mithilfe des Befehls apt-key zu authentifizieren.
    Mit dem Befehl apt-key wird die Liste der Schlüssel verwaltet, die von apt zum Authentifizieren von Paketen verwendet werden. Pakete, die mithilfe dieser Schlüssel authentifiziert wurden, werden als vertrauenswürdig eingestuft.
    sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
  6. Aktualisieren und installieren Sie das CUDA-Softwarepaket.
    sudo apt-get update
    sudo apt-get install cuda
  7. (Optional) Zum Bestätigen der GPU-Partitionsgröße oder Überprüfen der in Ihrer vSphere Bitfusion-Bereitstellung verfügbaren Ressourcen führen Sie die Überwachungsanwendung „NVIDIA System Management Interface (nvidia-smi)“ aus.
    bitfusion run -n 1 nvidia-smi
  8. Navigieren Sie zu dem Verzeichnis, das die CUDA Matrix Multiplication-Beispieldateien (matrixMul) enthält.
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  9. Führen Sie die Befehle make und bitfusion run für die matrixMul-Beispieldatei aus.
    sudo make
    bitfusion run -n 1 ./matrixMul

Nächste Maßnahme

Installieren und konfigurieren Sie NVIDIA cuDNN. Weitere Informationen finden Sie unter Vorgehensweise zum Installieren von NVIDIA cuDNN in vSphere Bitfusion.

Installieren von NVIDIA CUDA unter CentOS oder Red Hat Linux

Zum Ausführen von KI- und ML-Workflows in vSphere Bitfusion müssen Sie CUDA auf dem CentOS- oder Red Hat Linux-Betriebssystem Ihres vSphere Bitfusion-Clients installieren.

Voraussetzungen

Stellen Sie sicher, dass der vSphere Bitfusion-Client auf einem CentOS- oder Red Hat Linux-Betriebssystem installiert ist.

Prozedur

  1. Navigieren Sie zu einem Verzeichnis auf der virtuellen Maschine, in das die NVIDIA CUDA-Distribution heruntergeladen werden soll.
    cd <download_directory>
  2. Um das NVIDIA CUDA 11-Paket für CentOS 8 oder Red Hat Linux 8 herunterzuladen, führen Sie den Befehl wget aus.
    wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  3. Führen Sie den Befehl rpm -i aus, um das CUDA-Paket zu installieren.
    sudo rpm -i cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  4. Führen Sie die Befehle yum clean all und yum -y install wie angezeigt aus, um Ihre Anwendung zu aktualisieren und das CUDA-Softwarepaket zu installieren.
    sudo yum clean all
    sudo yum -y install cuda
  5. (Optional) Zum Bestätigen der GPU-Partitionsgröße oder Überprüfen der in Ihrer vSphere Bitfusion-Bereitstellung verfügbaren Ressourcen führen Sie die Überwachungsanwendung „NVIDIA System Management Interface (nvidia-smi)“ aus.
    bitfusion run -n 1 nvidia-smi
  6. Navigieren Sie zu dem Verzeichnis mit den CUDA Matrix Multiplication-Beispieldateien (matrixMul).
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  7. Führen Sie die Befehle make und bitfusion run für die matrixMul-Beispieldatei aus.
    sudo make
    bitfusion run -n 1 ./matrixMul

Nächste Maßnahme

Installieren und konfigurieren Sie NVIDIA cuDNN. Weitere Informationen finden Sie unter Vorgehensweise zum Installieren von NVIDIA cuDNN in vSphere Bitfusion.