VMware vSphere Bitfusion 3.5 | 2021년 5월 11일 | 빌드 5

릴리스 정보에 포함된 내용

릴리스 정보에는 다음과 같은 항목이 포함됩니다.

vSphere Bitfusion 정보

VMware vSphere Bitfusion은 GPU(그래픽 처리 장치)와 같은 가속기를 공유하여, 리소스 사용이 많은 AI(인공 지능) 및 ML(기계 학습) 워크로드를 지원할 수 있는 공유된 네트워크 액세스 가능 리소스 풀을 제공합니다. vSphere Bitfusion은 AI 프레임워크, 클라우드 사이트, 네트워크 및 가상 시스템, 컨테이너, 노트북 등의 환경에서 작동합니다.

vSphere Bitfusion 3.5의 새로운 기능

  • NVIDIA CUDA 11.2.2에 대한 지원이 추가됨
  • NVIDIA cuDNN 8.1.1에 대한 지원이 추가됨
  • NCCL(NVIDIA Collective Communications Library) 2.8.4에 대한 지원이 추가됨
  • PVRDMA에 대한 네트워크 성능 테스트 도구(예: ib_read_bw, ib_read_lat, ib_send_bw, ib_send_lat, ib_write_bw, ib_write_lat)가 이제 vSphere Bitfusion OVA 파일에 미리 설치됨

시스템 요구 사항

vSphere Bitfusion 클라이언트 및 서버에 대한 시스템 요구 사항 목록은 vSphere Bitfusion 설치 가이드를 참조하십시오.

호환성 및 상호 운용성

vSphere Bitfusion과 호환되는 버전, 모델 및 제품 목록은 VMware vSphere Bitfusion 호환성 및 상호 운용성 페이지를 참조하십시오.

오픈 소스 구성 요소

vSphere Bitfusion 3.5에 배포되는 오픈 소스 소프트웨어 구성 요소에 적용되는 저작권 정보 및 라이센스는 http://www.vmware.com에서 확인할 수 있습니다. 이 페이지에서는 최신 vSphere Bitfusion 릴리스에 소스 코드 또는 소스 코드 수정 사항을 사용하는 데 필요한 모든 GPL, LGPL 또는 기타 유사한 라이센스의 소스 파일을 다운로드할 수 있습니다.

해결된 문제

해결된 문제는 다음과 같이 분류됩니다.

VMware vSphere Bitfusion 3.5
  • 후속 vSphere Bitfusion 서버를 배포할 때 GPU 메모리를 지정할 수 없음

    이 문제는 이 릴리스에서 해결되었습니다. vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 때 GPU 선택 페이지에서 총 GPU 메모리를 지정하면 vSphere Bitfusion 서버 내 가상 시스템의 메모리와 MMIO 크기가 권장됩니다.

VMware vSphere Bitfusion 3.0.1
  • vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 경우 기본 네트워크는 표준 네트워크일 수만 있음

    이 문제는 이 릴리스에서 해결되었습니다. 기본 네트워크는 VMXNET3 또는 PVRDMA 어댑터가 있는 분산 포트 그룹일 수 있습니다.

  • CUDA 11.1 샘플 테스트로 인해 cuModuleGetGlobal_v2 모듈에서 오류가 발생할 수 있음

    이 문제는 이 릴리스에서 해결되었습니다.

VMware vSphere Bitfusion 3.0
  • Bitfusion 서버가 ping에 응답합니다. 이전 버전에서는 로컬 방화벽에서 ping 요청을 차단했습니다. 

    이 문제는 이 릴리스에서 해결되었습니다.

알려진 문제

알려진 문제는 다음과 같이 그룹화되어 있습니다.

GPU 문제
  • 가상 GPU가 지원되지 않음

    이 릴리스는 NVIDIA 가상 GPU 소프트웨어 및 NVIDIA GRID 가상 GPU 기술을 지원하지 않습니다.

  • 단일 GPU가 vCenter Server에 여러 번 나타날 수 있음

    NVIDIA T4 GPU는 vCenter Server에 여러 번 나타날 수 있습니다.

    해결 방법: ESXi 호스트의 BIOS 설정에서 SR-IOV 지원을 사용하도록 설정합니다.

vSphere Bitfusion 서버 문제
  • vSphere Bitfusion 플러그인이 vSphere Bitfusion 클라이언트의 복제된 가상 시스템에서 발생한 작업을 소스 가상 시스템에서 발생한 것으로 식별함

    vSphere Bitfusion 클라이언트 가상 시스템의 복제 작업 후에 vSphere Bitfusion 플러그인은 소스 가상 시스템과 복제된 가상 시스템 모두에서 발생한 작업을 소스 가상 시스템에서만 발생한 것처럼 식별합니다.

    해결 방법: 복제된 vSphere Bitfusion 클라이언트 가상 시스템의 /etc/hostname에서 호스트 이름 항목을 변경합니다.

  • vSphere Bitfusion 서버에서 시간을 변경하면 클러스터 장애가 발생할 수 있음

    클러스터를 생성한 후 서버 시간이 변경되거나 시간이 동기화되지 않으면 클러스터 장애가 발생할 수 있습니다.

    해결 방법:  클러스터의 모든 vSphere Bitfusion 서버는 동일한 시간으로 동기화되어야 합니다. 클러스터의 모든 서버 시간을 동기화하고 클러스터를 다시 시작하십시오.

  • 시간이 다른 서버로 인해 클러스터 장애가 발생할 수 있음

    DHCP를 사용하여 vSphere Bitfusion 서버의 IP 주소를 설정하고 DHCP 서버가 NTP 서버 정보를 제공하지 않거나 vSphere Bitfusion 서버의 IP 주소를 수동으로 입력하는 경우, 서버 간의 시간 차이로 인해 클러스터 장애가 발생할 수 있습니다. 모든 서버는 동일한 시간으로 동기화되어야 합니다.

    해결 방법: 서버 구성에 NTP 서버의 IP 주소를 추가합니다.

  • 가상 시스템을 복제하여 배포된 vSphere Bitfusion 서버를 클러스터에 가입시키지 못함 

    vSphere Bitfusion 서버의 가상 시스템을 복제하고 복제된 다른 서버 가상 시스템을 삭제한 후에는 새로 복제된 가상 시스템을 클러스터에 가입시키지 못할 수 있습니다.

  • vSphere Bitfusion 서버가 오프라인 상태인 경우 새 vSphere Bitfusion 서버를 클러스터에 추가할 수 없음

    클러스터에서 vSphere Bitfusion 서버 가상 시스템 하나가 오프라인 상태이면 다른 서버를 클러스터에 추가할 수 없습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • vSphere Bitfusion 플러그인을 사용하여 클러스터에서 서버를 제거합니다.
    • vSphere Client를 사용하여 게스트 운영 체제 환경 변수 guestinfo.bitfusion.server.cassandra-removenode를 서버 가상 시스템에 설정합니다.
    • 실행 중인 vSphere Bitfusion 서버의 터미널에서 bitfusion removenode 명령을 실행합니다.
  • vSphere Bitfusion 서버 가상 시스템 복제 또는 후속 vSphere Bitfusion 서버 설치 후 필수 필드가 없거나 불완전하여 새 가상 시스템을 시작할 수 없음

    vCenter Server에서 서버 가상 시스템의 복제 작업을 수행하는 동안 필수 필드가 마법사에서 필수 필드로 표시되지 않습니다. vCenter Server에서 후속 vSphere Bitfusion 서버를 설치하는 동안 필드가 잘못 지정될 수 있습니다. 그 결과 가상 시스템을 시작하지 못할 수 있습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • 복제 또는 설치 작업 중에 모든 필드가 올바르게 지정되었는지 확인합니다.
    • 복제 또는 설치 작업이 완료되면 vCenter vApp 옵션 편집기를 사용하여 필드의 값을 변경합니다. 모든 속성 목록은 vSphere Bitfusion vApp 속성을 참조하십시오.
      1. vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.
      2. 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.
      3. 목록에서 속성을 선택하고 값 설정 버튼을 클릭합니다.
  • 소스 가상 시스템을 삭제한 후 복제된 가상 시스템을 시작할 수 없음

    vSphere Bitfusion 가상 시스템의 복제 작업 후 복제된 가상 시스템의 전원을 켜기 전에 소스 가상 시스템이 삭제되면 복제된 가상 시스템을 시작할 수 없습니다.

    해결 방법: 복제된 가상 시스템의 전원을 켭니다. 그런 다음 소스 가상 시스템을 삭제합니다.

네트워킹 문제
  • 후속 vSphere Bitfusion 서버의 설치 절차가 실패할 수 있음 

    후속 vSphere Bitfusion 서버를 배포할 때 기본 vSphere Bitfusion 서버는 HTTPS API를 사용하여 후속 ESXi 호스트에 연결합니다. vSphere Bitfusion 서버의 관리 네트워크 인터페이스 및 ESXi 호스트의 vmx0 인터페이스에서 9000바이트의 MTU 크기를 사용 중이지만 네트워크가 두 인터페이스 간에 이 MTU 크기를 지원하지 않는 경우 HTTPS 연결이 중단되고 설치 절차가 실패할 수 있습니다.

    해결 방법:

    1. 두 인터페이스 간에 지원되는 최대 MTU 크기를 결정합니다.
      1. vSphere Bitfusion 서버의 터미널에 연결하려면 ssh customer@$server_ip를 실행합니다.
      2. 다음 셸 스크립트를 실행합니다.
        • target_host=(ESXi 호스트 IP 또는 DNS 이름)
          size=1272

          while ping -s $size -M do -c1 $target_host >&/dev/nulldo
              ((size+=4));
          done

          echo "Max MTU size: $((size-4+28))
    2. ​​ESXi 호스트의 vmx0 인터페이스에 대한 MTU 크기 값을 두 인터페이스 간에 지원되는 최대 MTU 크기로 변경합니다.
  • 복제된 vSphere Bitfusion 서버의 네트워크 어댑터를 구성할 수 없음

    vCenter Server에서 vSphere Bitfusion 서버 가상 시스템을 복제하는 동안에는 추가 네트워크 어댑터에 대한 구성을 변경할 수 없습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • 원래 가상 시스템을 생성하는 경우 복제된 가상 시스템에 필요한 네트워크 인터페이스를 사용하도록 설정합니다.
    • vCenter vApp 옵션 편집기를 사용하여 네트워크 설정의 값을 변경합니다. 모든 속성 목록은 vSphere Bitfusion vApp 속성을 참조하십시오.
      1. vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.
      2. 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.
      3. 목록에서 속성을 선택하고 값 설정 버튼을 클릭합니다.
  • 둘 이상의 네트워크 인터페이스를 네트워크에 연결할 수 없음

    특정 네트워크에는 네트워크 인터페이스를 하나만 연결할 수 있습니다. 

    해결 방법: Bitfusion 서버를 여러 네트워크에 연결하려면 여러 네트워크 인터페이스를 사용합니다.

  • 인터넷 프로토콜 버전 6이 지원되지 않음

    이 릴리스에서는 IPv6가 지원되지 않습니다.

기타 문제
  • vSphere Bitfusion 클러스터의 복원 작업이 실패함

    백업에서 vSphere Bitfusion 클러스터를 복원한 후 데이터 손실이 발생할 수 있으며 vSphere Bitfusion 플러그인의 글로벌 설정을 변경하지 못할 수 있습니다.

    해결 방법: 모든 vSphere Bitfusion 서버를 순차적으로 다시 시작하고 각 서버를 다시 시작한 후 60초 동안 기다립니다.

  • 빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있음

    vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 때 빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있습니다. 일반적으로 대부분의 브라우저에는 5분의 시간 초과 제한이 있으며 vSphere Bitfusion OVA 파일 크기는 약 740MB입니다. 

    해결 방법: URL에서 OVA 파일을 선택합니다.

  • 지정된 기간에 대한 vSphere Bitfusion 모니터링 데이터를 다운로드할 수 없음

    vSphere Bitfusion 플러그인의 탭에서 CSV 다운로드 버튼을 클릭하면 지정된 기간이 무시되고 다운로드된 파일에는 2일 간의 데이터가 포함됩니다.

check-circle-line exclamation-circle-line close-line
Scroll to top icon