VMware vSphere Bitfusion 4.0 | 2021년 8월 17일 | 빌드 13 VMware vSphere Bitfusion 4.0.1 | 2021년 9월 16일 | 빌드 5 이 릴리스 정보의 추가 사항 및 업데이트 사항을 확인하십시오. |
새로운 기능
릴리스 정보에 포함된 내용
릴리스 정보에는 다음과 같은 항목이 포함됩니다.
- vSphere Bitfusion 정보
- vSphere Bitfusion 4.0의 새로운 기능
- 시스템 요구 사항
- 호환성 및 상호 운용성
- 오픈 소스 구성 요소
- 해결된 문제
- 알려진 문제
vSphere Bitfusion 정보
VMware vSphere Bitfusion은 GPU(그래픽 처리 장치)와 같은 가속기를 공유하여, 리소스 사용이 많은 AI(인공 지능) 및 ML(기계 학습) 워크로드를 지원할 수 있는 공유된 네트워크 액세스 가능 리소스 풀을 제공합니다. vSphere Bitfusion은 AI 프레임워크, 클라우드 사이트, 네트워크 및 가상 시스템, 컨테이너, 노트북 등의 환경에서 작동합니다.
vSphere Bitfusion 4.0의 새로운 기능
- 특정 GPU 또는 vSphere Bitfusion 서버 집합에서 워크로드를 실행하도록 향상된 스케줄링이 추가되었습니다.
- 기간별 vSphere Bitfusion 데이터를 저장하는 기간을 지정하는 데이터 보존 정책이 추가되었습니다.
- vSphere Bitfusion 서버의 상태를 확인하기 위한 모니터링 플러그인이 추가되었습니다.
- vSphere Bitfusion에서 Kubernetes 암호로 클라이언트 인증 토큰을 게시할 수 있습니다.
- 이제 vSphere Bitfusion에서 vCenter Server 어두운 테마가 지원됩니다.
- Ubuntu 16.04 클라이언트에 대한 지원은 vSphere Bitfusion 4.0.0에서 제거되었습니다.
- vSphere Bitfusion 2.x.x 클라이언트에 대한 지원은 중단되었으며 향후 vSphere Bitfusion 릴리스에서 제거될 예정입니다.
시스템 요구 사항
vSphere Bitfusion 클라이언트 및 서버에 대한 시스템 요구 사항 목록은 vSphere Bitfusion 설치 가이드를 참조하십시오.
호환성 및 상호 운용성
vSphere Bitfusion과 호환되는 버전, 모델 및 제품 목록은 VMware vSphere Bitfusion 호환성 및 상호 운용성 페이지를 참조하십시오.
오픈 소스 구성 요소
vSphere Bitfusion 3.5에 배포되는 오픈 소스 소프트웨어 구성 요소에 적용되는 저작권 정보 및 라이센스는 http://www.vmware.com에서 확인할 수 있습니다. 이 페이지에서는 최신 vSphere Bitfusion 릴리스에 소스 코드 또는 소스 코드 수정 사항을 사용하는 데 필요한 모든 GPL, LGPL 또는 기타 유사한 라이센스의 소스 파일을 다운로드할 수 있습니다.
해결된 문제 4.0.1
-
vSphere Bitfusion 서버가 GPU API 불일치 및 GPU Xid 오류를 보고할 수 있음
vSphere Bitfusion 서버에서
bitfusion user
로bitfusion localhealth
명령을 실행하는 경우 서버가 GPU API 불일치 및 GPU Xid 오류를 보고할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다. -
vSphere Bitfusion 클라이언트가 vSphere Bitfusion 서버에 연결할 수 없음
클라이언트 인증 토큰을 사용하여 vSphere Bitfusion 클라이언트를 사용하도록 설정하고 클라이언트가 서버와 다른 하위 네트워크를 사용하는 경우 클라이언트가 vSphere Bitfusion 서버에 연결할 수 없습니다. 이 문제는 이 릴리스에서 해결되었습니다.
-
vSphere Bitfusion 서버의 글로벌 상태 점검 설정을 기본 설정으로 지정하면 작업이 실패할 수 있음
이 문제는 이 릴리스에서 해결되었습니다.
-
vSphere Bitfusion 서버의 비활성화된 상태 점검을 활성화하면 작업이 실패할 수 있음
이 문제는 이 릴리스에서 해결되었습니다.
해결된 문제 3.5
-
후속 vSphere Bitfusion 서버를 배포할 때 GPU 메모리를 지정할 수 없음
이 문제는 이 릴리스에서 해결되었습니다. vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 때 GPU 선택 페이지에서 총 GPU 메모리를 지정하면 vSphere Bitfusion 서버 내 가상 시스템의 메모리와 MMIO 크기가 권장됩니다.
해결된 문제 3.0.1
-
vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 경우 기본 네트워크는 표준 네트워크일 수만 있음
이 문제는 이 릴리스에서 해결되었습니다. 기본 네트워크는 VMXNET3 또는 PVRDMA 어댑터가 있는 분산 포트 그룹일 수 있습니다.
-
CUDA 11.1 샘플 테스트로 인해 cuModuleGetGlobal_v2 모듈에서 오류가 발생할 수 있음
이 문제는 이 릴리스에서 해결되었습니다.
알려진 문제: GPU 문제
-
가상 GPU가 지원되지 않음
이 릴리스는 NVIDIA 가상 GPU 소프트웨어 및 NVIDIA GRID 가상 GPU 기술을 지원하지 않습니다.
-
단일 GPU가 vCenter Server에 여러 번 나타날 수 있음
NVIDIA T4 GPU는 vCenter Server에 여러 번 나타날 수 있습니다.
해결 방법: ESXi 호스트의 BIOS 설정에서 SR-IOV 지원을 사용하도록 설정합니다.
알려진 문제: vSphere Bitfusion 서버 문제
-
vSphere Bitfusion 클라이언트 가상 시스템의 복제 작업 후에 vSphere Bitfusion 플러그인은 소스 가상 시스템과 복제된 가상 시스템 모두에서 발생한 작업을 소스 가상 시스템에서만 발생한 것처럼 식별합니다.
vSphere Bitfusion 클라이언트 가상 시스템의 복제 작업 후에 vSphere Bitfusion 플러그인은 소스 가상 시스템과 복제된 가상 시스템 모두에서 발생한 작업을 소스 가상 시스템에서만 발생한 것처럼 식별합니다.
해결 방법: 복제된 vSphere Bitfusion 클라이언트 가상 시스템의
/etc/hostname
에서 호스트 이름 항목을 변경합니다. -
vSphere Bitfusion 서버에서 시간을 변경하면 클러스터 장애가 발생할 수 있음
클러스터를 생성한 후 서버 시간이 변경되거나 시간이 동기화되지 않으면 클러스터 장애가 발생할 수 있습니다.
해결 방법: 클러스터의 모든 vSphere Bitfusion 서버는 동일한 시간으로 동기화되어야 합니다. 클러스터의 모든 서버 시간을 동기화하고 클러스터를 다시 시작하십시오.
-
시간이 다른 서버로 인해 클러스터 장애가 발생할 수 있음
DHCP를 사용하여 vSphere Bitfusion 서버의 IP 주소를 설정하고 DHCP 서버가 NTP 서버 정보를 제공하지 않거나 vSphere Bitfusion 서버의 IP 주소를 수동으로 입력하는 경우, 서버 간의 시간 차이로 인해 클러스터 장애가 발생할 수 있습니다. 모든 서버는 동일한 시간으로 동기화되어야 합니다.
해결 방법: 서버 구성에 NTP 서버의 IP 주소를 추가합니다.
-
가상 시스템을 복제하여 배포된 vSphere Bitfusion 서버를 클러스터에 가입시키지 못함
vSphere Bitfusion 서버의 가상 시스템을 복제하고 복제된 다른 서버 가상 시스템을 삭제한 후에는 새로 복제된 가상 시스템을 클러스터에 가입시키지 못할 수 있습니다.
-
vSphere Bitfusion 서버가 오프라인 상태인 경우 새 vSphere Bitfusion 서버를 클러스터에 추가할 수 없음
클러스터에서 vSphere Bitfusion 서버 가상 시스템 하나가 오프라인 상태이면 다른 서버를 클러스터에 추가할 수 없습니다.
해결 방법: 다음 작업 중 하나를 수행합니다.
- vSphere Bitfusion 플러그인을 사용하여 클러스터에서 서버를 제거합니다.
- vSphere Client를 사용하여 게스트 운영 체제 환경 변수
guestinfo.bitfusion.server.cassandra-removenode
를 서버 가상 시스템에 설정합니다. - 실행 중인 vSphere Bitfusion 서버의 터미널에서
bitfusion removenode
명령을 실행합니다.
-
vSphere Bitfusion 서버 가상 시스템 복제 또는 후속 vSphere Bitfusion 서버 설치 후 필수 필드가 없거나 불완전하여 새 가상 시스템을 시작할 수 없음
vCenter Server에서 서버 가상 시스템의 복제 작업을 수행하는 동안 필수 필드가 마법사에서 필수 필드로 표시되지 않습니다. vCenter Server에서 후속 vSphere Bitfusion 서버를 설치하는 동안 필드가 잘못 지정되었을 수 있습니다. 그 결과 가상 시스템을 시작하지 못할 수 있습니다.
해결 방법: 다음 작업 중 하나를 수행합니다.
- 복제 또는 설치 작업 중에 모든 필드가 올바르게 지정되었는지 확인합니다.
- 복제 또는 설치 작업이 완료되면 vCenter vApp 옵션 편집기를 사용하여 필드의 값을 변경합니다. 모든 속성 목록은 vSphere Bitfusion vApp 속성을 참조하십시오.
- vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.
- 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.
- 목록에서 속성을 선택하고 값 설정 버튼을 클릭합니다.
-
소스 가상 시스템을 삭제한 후 복제된 가상 시스템을 시작할 수 없음
vSphere Bitfusion 가상 시스템의 복제 작업 후 복제된 가상 시스템의 전원을 켜기 전에 소스 가상 시스템이 삭제되면 복제된 가상 시스템을 시작할 수 없습니다.
해결 방법: 복제된 가상 시스템의 전원을 켭니다. 그런 다음 소스 가상 시스템을 삭제합니다.
알려진 문제: 네트워킹 문제
-
후속 vSphere Bitfusion 서버의 설치 절차가 실패할 수 있음
후속 vSphere Bitfusion 서버를 배포할 때 기본 vSphere Bitfusion 서버는 HTTPS API를 사용하여 후속 ESXi 호스트에 연결합니다. vSphere Bitfusion 서버의 관리 네트워크 인터페이스 및 ESXi 호스트의 vmx0 인터페이스에서 9000바이트의 MTU 크기를 사용 중이지만 네트워크가 두 인터페이스 간에 이 MTU 크기를 지원하지 않는 경우 HTTPS 연결이 중단되고 설치 절차가 실패할 수 있습니다.
해결 방법:
- 두 인터페이스 간에 지원되는 최대 MTU 크기를 결정합니다.
- vSphere Bitfusion 서버의 터미널에 연결하려면
ssh customer@$server_ip
를 실행합니다. - 다음 셸 스크립트를 실행합니다.
-
target_host=(ESXi host IP or DNS name) size=1272 while ping -s $size -M do -c1 $target_host >&/dev/null; do ((size+=4)); done echo "Max MTU size: $((size-4+28))
-
- vSphere Bitfusion 서버의 터미널에 연결하려면
- ESXi 호스트의 vmx0 인터페이스에 대한 MTU 크기 값을 두 인터페이스 간에 지원되는 최대 MTU 크기로 변경합니다.
- 두 인터페이스 간에 지원되는 최대 MTU 크기를 결정합니다.
-
복제된 vSphere Bitfusion 서버의 네트워크 어댑터를 구성할 수 없음
vCenter Server에서 vSphere Bitfusion 서버 가상 시스템을 복제하는 동안은 추가 네트워크 어댑터에 대한 구성을 변경할 수 없습니다.
해결 방법: 다음 작업 중 하나를 수행합니다.
- 원래 가상 시스템을 생성하는 경우 복제된 가상 시스템에 필요한 네트워크 인터페이스를 사용하도록 설정합니다.
- vCenter vApp 옵션 편집기를 사용하여 네트워크 설정의 값을 변경합니다. 모든 속성 목록은 vSphere Bitfusion vApp 속성을 참조하십시오.
- vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.
- 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.
- 목록에서 속성을 선택하고 값 설정 버튼을 클릭합니다.
-
둘 이상의 네트워크 인터페이스를 네트워크에 연결할 수 없음
특정 네트워크에는 네트워크 인터페이스를 하나만 연결할 수 있습니다.
해결 방법: Bitfusion 서버를 여러 네트워크에 연결하려면 여러 네트워크 인터페이스를 사용합니다.
-
인터넷 프로토콜 버전 6이 지원되지 않음
이 릴리스에서는 IPv6가 지원되지 않습니다.
알려진 문제: 기타 문제
-
vSphere Bitfusion 장치를 배포하는 동안 vCenter Server가 잘못된 vSphere Bitfusion 인증서 주의를 보고할 수 있음
vSphere Bitfusion 4.0 장치를 사용하여 vCenter Server 7.0.2 에 기본 vSphere Bitfusion 서버를 설치하는 경우 OVF 템플릿 배포 대화상자의 세부 정보 보기 페이지에 다음과 같은 주의가 표시될 수 있습니다.
Invalid certificate.
이 주의는 잘못되었으며 vSphere Bitfusion 인증서가 유효합니다.해결 방법: 주의를 무시하고 다음을 클릭하여 OVF 템플릿 세부 정보를 확인합니다. 이 문제는 향후 vCenter Server 릴리스에서 해결됩니다.
-
상태 로그 대화상자의 글로벌 기본값 일치 버튼이 비활성화될 수 있음
설정 > 글로벌 상태 점검 기본값 탭에서 모든 vSphere Bitfusion 서버에 대한 글로벌 상태 점검 설정을 수정하고 vSphere Bitfusion 서버의 상태 점검을 수행한 후 상태 로그 대화상자의 글로벌 기본값 일치 버튼이 비활성화될 수 있습니다. 이는 JavaScript 오류입니다.
해결 방법: 전환 버튼을 클릭하여 상태 점검을 활성화하거나 비활성화하고 저장을 클릭합니다.
-
vSphere Bitfusion 3.0 클러스터의 복원 작업이 실패함
백업에서 다중 노드 vSphere Bitfusion 클러스터를 복원한 후 데이터 손실이 발생할 수 있으며 vSphere Bitfusion 플러그인의 글로벌 설정을 변경하지 못할 수 있습니다.
해결 방법: 모든 vSphere Bitfusion 서버를 순차적으로 다시 시작하고 각 서버를 다시 시작한 후 60초 동안 기다립니다.
-
vSphere Bitfusion 4.0 클러스터의 복원 작업이 실패함
백업에서 다중 서버 vSphere Bitfusion 4.0 클러스터를 복원한 후 Apache Cassandra 오류가 발생할 수 있습니다.
해결 방법: 현재 기본 및 후속 vSphere Bitfusion 서버의 호스트 ID를 사용하여 vSphere Bitfusion 4.0 장치와 함께 새 서버 가상 시스템을 배포하고 백업을 복원합니다. 필요한 모든 단계의 자세한 목록은 vSphere Bitfusion 설치 가이드에서 서버 업그레이드 절차를 참조하십시오.
-
빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있음
vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 때 빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있습니다. 일반적으로 대부분의 브라우저에는 5분의 시간 초과 제한이 있으며 vSphere Bitfusion OVA 파일 크기는 약 740MB입니다.
해결 방법: URL에서 OVA 파일을 선택합니다.
-
지정된 기간에 대한 vSphere Bitfusion 모니터링 데이터를 다운로드할 수 없음
vSphere Bitfusion 플러그인의 탭에서 CSV 다운로드 버튼을 클릭하면 지정된 기간이 무시되고 다운로드된 파일에는 2일 간의 데이터가 포함됩니다.
-
CentOS 7 및 8에 설치된 vSphere Bitfusion 3.5 이하 클라이언트에서 라이브러리 오류가 발생할 수 있음
CentOS 7 및 8용 vSphere Bitfusion 3.5 이하 클라이언트는 EPEL capstone RPM 패키지에서 설치된
libcapstone.so.3
라이브러리에 종속됩니다. capstone 패키지에는 현재libcapstone.so.4
라이브러리만 포함되어 있습니다. vSphere Bitfusion 클라이언트가 설치된 후 클라이언트는 EPEL에서 최신 패키지를 다운로드하여 설치합니다. 이 패키지에는 최신 라이브러리가 포함되어 있으며 이로 인해 다음 오류 메시지가 표시될 수 있습니다.error while loading shared libraries: libcapstone.so.3: cannot open shared object
.해결 방법: 다음 작업 중 하나를 수행합니다.
- vSphere Bitfusion 서버 및 클라이언트를 버전 4.0.0 이상으로 업데이트합니다.
libcapstone.so.3
라이브러리가 포함된 이전 버전의 capstone 패키지를 설치합니다.
-
vSphere Bitfusion 2.5 이상 라이센스를 사용하면 vCenter Server 버전 7.0.0 이하에서 오류가 발생할 수 있음
vCenter Server 버전 7.0.0 이하의 경우 vSphere Bitfusion은 문자열을 사용하여 vSphere Bitfusion 라이센스의 유효성을 확인합니다. 문자열이 일치하지 않으면 라이센싱 문제가 발생할 수 있습니다.
해결 방법: vCenter Server를 버전 7.0.2 이상으로 업그레이드합니다.