Compute Unified Device Architecture (CUDA) es una plataforma de informática y un modelo de programación paralelo desarrollado por NVIDIA para informática en general en las unidades de procesamiento gráfico (GPU). CUDA acelera considerablemente las aplicaciones informáticas mediante la potencia de procesamiento de las GPU. Por ejemplo, los bancos de pruebas de TensorFlow y PyTorch utilizan CUDA.

Instalar NVIDIA CUDA en Ubuntu

Para ejecutar flujos de trabajo de IA y ML en vSphere Bitfusion, debe instalar CUDA en el sistema operativo Ubuntu Linux del cliente de vSphere Bitfusion.

Requisitos previos

Compruebe que haya instalado el cliente de vSphere Bitfusion en un sistema operativo Ubuntu Linux.

Procedimiento

  1. Desplácese hasta un directorio de la máquina virtual en la que se va a descargar la distribución de NVIDIA CUDA.
    cd <download_directory>
  2. Descargue y mueva el archivo cuda-ubuntu2004.pin.
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. Descargue la distribución de NVIDIA CUDA para Ubuntu 20.04 mediante el comando wget.
    wget <https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb>
  4. Instale el paquete CUDA 11 para Ubuntu 20.04 mediante el comando dpkg -i.
    sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  5. Instale las claves para autenticar el paquete de software mediante el comando apt-key.
    El comando apt-key administra la lista de claves que utiliza apt para autenticar los paquetes. Los paquetes que se autenticaron con estas claves se consideran de confianza.
    sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
  6. Actualice e instale el paquete de software de CUDA.
    sudo apt-get update
    sudo apt-get install cuda
  7. (opcional) Para confirmar el tamaño de la partición de GPU o comprobar los recursos disponibles en la implementación de vSphere Bitfusion, ejecute la aplicación de supervisión de la interfaz de administración del sistema NVIDIA (nvidia-smi).
    bitfusion run -n 1 nvidia-smi
  8. Desplácese hasta el directorio que contiene los archivos de ejemplo de multiplicación de matrices de CUDA (matrixMul).
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  9. Ejecute los comandos make y bitfusion run en el archivo de ejemplo matrixMul.
    sudo make
    bitfusion run -n 1 ./matrixMul

Qué hacer a continuación

Instale y configure NVIDIA cuDNN. Consulte Cómo instalar NVIDIA cuDNN en vSphere Bitfusion.

Instalar NVIDIA CUDA en CentOS o Red Hat Linux

Para ejecutar flujos de trabajo de IA y ML en vSphere Bitfusion, debe instalar CUDA en el sistema operativo CentOS o Red Hat Linux del cliente de vSphere Bitfusion.

Requisitos previos

Compruebe que haya instalado el cliente de vSphere Bitfusion en un sistema operativo CentOS o Red Hat Linux.

Procedimiento

  1. Desplácese hasta el directorio de la máquina virtual en la que se va a descargar la distribución de NVIDIA CUDA.
    cd <download_directory>
  2. Para descargar el paquete de NVIDIA CUDA 11 para CentOS 8 o Red Hat Linux 8, ejecute el comando wget.
    wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  3. Para instalar el paquete de CUDA, ejecute el comando rpm -i.
    sudo rpm -i cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  4. Ejecute los comandos yum clean all y yum -y install como se muestra para actualizar el entorno e instalar el paquete de software de CUDA.
    sudo yum clean all
    sudo yum -y install cuda
  5. (opcional) Para confirmar el tamaño de la partición de GPU o comprobar los recursos disponibles en la implementación de vSphere Bitfusion, ejecute la aplicación de supervisión de la interfaz de administración del sistema NVIDIA (nvidia-smi).
    bitfusion run -n 1 nvidia-smi
  6. Desplácese hasta el directorio que contiene los archivos de ejemplo de multiplicación de matrices de CUDA (matrixMul).
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  7. Ejecute los comandos make y bitfusion run en el archivo de ejemplo matrixMul.
    sudo make
    bitfusion run -n 1 ./matrixMul

Qué hacer a continuación

Instale y configure NVIDIA cuDNN. Consulte Cómo instalar NVIDIA cuDNN en vSphere Bitfusion.