CUDA(Compute Unified Device Architecture)는 GPU(그래픽 처리 장치)의 일반 컴퓨팅을 위해 NVIDIA에서 개발한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델입니다. CUDA는 GPU의 처리 능력을 사용하여 컴퓨팅 애플리케이션의 속도를 획기적으로 향상시킵니다. 예를 들어 CUDA는 TensorFlow 및 PyTorch 벤치마크에서 사용됩니다.

Ubuntu에 NVIDIA CUDA 설치

vSphere Bitfusion에서 AI 및 ML 워크플로를 실행하려면 vSphere Bitfusion 클라이언트의 Ubuntu Linux 운영 체제에 CUDA를 설치해야 합니다.

사전 요구 사항

Ubuntu Linux 운영 체제에 vSphere Bitfusion 클라이언트를 설치했는지 확인합니다.

프로시저

  1. NVIDIA CUDA 배포를 다운로드할 가상 시스템의 디렉토리로 이동합니다.
    cd <download_directory>
  2. cuda-ubuntu2004.pin 파일을 다운로드하여 이동합니다.
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. wget 명령을 사용하여 Ubuntu 20.04용 NVIDIA CUDA 배포를 다운로드합니다.
    wget <https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb>
  4. dpkg -i 명령을 사용하여 Ubuntu 20.04용 CUDA 11 패키지를 설치합니다.
    sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
  5. apt-key 명령을 사용하여 소프트웨어 패키지를 인증하는 키를 설치합니다.
    apt-key 명령은 apt가 패키지를 인증하는 데 사용하는 키 목록을 관리합니다. 이러한 키를 사용하여 인증된 패키지는 신뢰할 수 있는 것으로 간주됩니다.
    sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
  6. CUDA 소프트웨어 패키지를 업데이트하고 설치합니다.
    sudo apt-get update
    sudo apt-get install cuda
  7. (선택 사항) GPU 파티션 크기를 확인하거나 vSphere Bitfusion 배포에서 사용할 수 있는 리소스를 확인하려면 NVIDIA 시스템 관리 인터페이스(nvidia-smi) 모니터링 애플리케이션을 실행합니다.
    bitfusion run -n 1 nvidia-smi
  8. CUDA Matrix Multiplication(matrixMul) 샘플 파일이 포함된 디렉토리로 이동합니다.
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  9. matrixMul 샘플 파일에 대해 makebitfusion run 명령을 실행합니다.
    sudo make
    bitfusion run -n 1 ./matrixMul

다음에 수행할 작업

NVIDIA cuDNN을 설치하고 구성합니다. vSphere Bitfusion에서 NVIDIA cuDNN을 설치하는 방법의 내용을 참조하십시오.

CentOS 또는 Red Hat Linux에 NVIDIA CUDA 설치

vSphere Bitfusion에서 AI 및 ML 워크플로를 실행하려면 vSphere Bitfusion 클라이언트의 CentOS 또는 Red Hat Linux 운영 체제에 CUDA를 설치해야 합니다.

사전 요구 사항

CentOS 또는 Red Hat Linux 운영 체제에 vSphere Bitfusion 클라이언트를 설치했는지 확인합니다.

프로시저

  1. NVIDIA CUDA 배포를 다운로드할 가상 시스템의 디렉토리로 이동합니다.
    cd <download_directory>
  2. CentOS 8 또는 Red Hat Linux 8용 NVIDIA CUDA 11 패키지를 다운로드하려면 wget 명령을 실행합니다.
    wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  3. CUDA 패키지를 설치하려면 rpm -i 명령을 실행합니다.
    sudo rpm -i cuda-repo-rhel8-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
  4. yum clean allyum -y install 명령을 표시된 대로 실행하여 환경을 업데이트하고 CUDA 소프트웨어 패키지를 설치합니다.
    sudo yum clean all
    sudo yum -y install cuda
  5. (선택 사항) GPU 파티션 크기를 확인하거나 vSphere Bitfusion 배포에서 사용할 수 있는 리소스를 확인하려면 NVIDIA 시스템 관리 인터페이스(nvidia-smi) 모니터링 애플리케이션을 실행합니다.
    bitfusion run -n 1 nvidia-smi
  6. CUDA Matrix Multiplication(matrixMul) 샘플 파일이 포함된 디렉토리로 이동합니다.
    cd /usr/local/cuda/samples/0_Simple/matrixMul 
  7. matrixMul 샘플 파일에 대해 makebitfusion run 명령을 합니다.
    sudo make
    bitfusion run -n 1 ./matrixMul

다음에 수행할 작업

NVIDIA cuDNN을 설치하고 구성합니다. vSphere Bitfusion에서 NVIDIA cuDNN을 설치하는 방법의 내용을 참조하십시오.