VMware vSphere Bitfusion 4.5 | 2021년 11월 23일 | 빌드 4

VMware vSphere Bitfusion 4.5.1 | 2022년 1월 27일 | 빌드 9

VMware vSphere Bitfusion 4.5.2 | 2022년 6월 23일 | 빌드 16

VMware vSphere Bitfusion 4.5.3 | 2023년 2월 21일 | 빌드 4

VMware vSphere Bitfusion 4.5.4 | 2023년 5월 9일 | 빌드 6

릴리스 정보에 포함된 내용

릴리스 정보에는 다음과 같은 항목이 포함됩니다.

vSphere Bitfusion 정보

VMware vSphere Bitfusion은 GPU(그래픽 처리 장치)와 같은 가속기를 공유하여, 리소스 사용이 많은 AI(인공 지능) 및 ML(기계 학습) 워크로드를 지원할 수 있는 공유된 네트워크 액세스 가능 리소스 풀을 제공합니다. vSphere Bitfusion은 AI 프레임워크, 클라우드 사이트, 네트워크 및 가상 시스템, 컨테이너, 노트북 등의 환경에서 작동합니다.

4.5.4의 새로운 기능

  • Apache Cassandra 데이터베이스에서 발생할 수 있는 문제를 해결하기 위해 일일 nodetool repair 검색이 추가되었습니다. 

4.5.3의 새로운 기능

  • vSphere Bitfusion은 VMware vSphere 8.0에서 지원됩니다.

  • vSphere Bitfusion 클라이언트의 만료 날짜는 vSphere Bitfusion 사용자 인터페이스를 사용하여 연장할 수 있습니다.

  • Red Hat Enterprise Linux 9.0 이상 부 버전에 대한 지원이 추가되었습니다.

  • Rocky Linux 8에 대한 지원이 추가되었습니다.

  • Rocky Linux 9에 대한 지원이 추가되었습니다.

  • NVIDIA Driver 525.85.12에 대한 지원이 추가되었습니다.

  • NVIDIA CUDA 11.5 및 11.5.2에 대한 지원이 추가되었습니다.

  • Pytorch 1.9 및 1.10에 대한 프레임워크 지원이 추가되었습니다.

  • NVIDIA A40 48GB PCIE에 대한 하드웨어 지원이 추가되었습니다.

  • NVIDIA L40 48GB PCIE에 대한 하드웨어 지원이 추가되었습니다.

  • NVIDIA A30 24GB PCIE에 대한 하드웨어 지원이 추가되었습니다.

  • NVIDIA A10 24GB PCIE에 대한 하드웨어 지원이 추가되었습니다.

  • NVIDIA A2 16GB PCIE에 대한 하드웨어 지원이 추가되었습니다.

4.5.2의 새로운 기능

  • vSphere Bitfusion 클라이언트는 vSphere Bitfusion 명령줄 인터페이스에 현재 GPU 할당 및 활용률을 표시할 수 있습니다.

  • run 또는 request 명령을 실행할 때 vSphere Bitfusion 클라이언트에 레이블을 지정할 수 있으므로 vSphere Bitfusion 사용자 인터페이스에서 클라이언트를 더 잘 식별할 수 있습니다.

  • vSphere Bitfusion 서버 인증서는 vSphere Bitfusion 명령줄 인터페이스를 사용하여 갱신할 수 있습니다.

  • vSphere Bitfusion 클라이언트 인증서는 vSphere Bitfusion 사용자 인터페이스를 사용하여 갱신할 수 있습니다.

  • Ubuntu Linux 22.04에 대한 지원이 추가되었습니다.

  • SUSE Linux Enterprise Server 15.3에 대한 지원이 추가되었습니다.

  • Red Hat Enterprise Linux 7.9 이상 부 버전에 대한 지원이 추가되었습니다.

  • Red Hat Enterprise Linux 8.5 이상 부 버전에 대한 지원이 추가되었습니다.

  • NVIDIA Driver 470.129.06에 대한 지원이 추가되었습니다.

  • NVIDIA CUDA 11.3 및 11.4.4에 대한 지원이 추가되었습니다.

  • NVIDIA cuDNN 8.2.4에 대한 지원이 추가되었습니다.

  • PyTorch 1.2 - 1.8에 대한 지원이 추가되었습니다.

  • Tensorflow 1.15,2.2, 2.3, 2.4 및 2.6에 대한 지원이 추가되었습니다.

  • TensorRT 7.1.3, 7.2.3 및 8.0.3에 대한 지원이 추가되었습니다.

  • PaddlePaddle 2.0.0, 2.2.2 및 2.3.0에 대한 지원이 추가되었습니다.

  • CentOS 8에 대한 지원이 제거되었습니다.

4.5의 새로운 기능

  • vSphere Bitfusion은 vSphere Bitfusion 클러스터의 메모리 활용률 및 코어 활용률에 대한 정보를 표시합니다.

  • vSphere Bitfusion 2.x.x 클라이언트에 대한 지원은 vSphere Bitfusion 4.5.0에서 제거되었습니다.

시스템 요구 사항

vSphere Bitfusion 클라이언트 및 서버에 대한 시스템 요구 사항 목록은 vSphere Bitfusion 설치 가이드를 참조하십시오.

호환성 및 상호 운용성

vSphere Bitfusion과 호환되는 버전, 모델 및 제품 목록은 VMware 상호 운용성 매트릭스 페이지를 참조하십시오.

수명 주기

지원되는 vSphere Bitfusion 버전 및 해당 수명 주기의 목록은 VMware 제품 수명 주기 매트릭스를 참조하십시오.

오픈 소스 구성 요소

vSphere Bitfusion 4.5에 배포되는 오픈 소스 소프트웨어 구성 요소에 적용되는 저작권 정보 및 라이센스는 http://www.vmware.com에서 확인할 수 있습니다. 이 페이지에서는 최신 vSphere Bitfusion 릴리스에 소스 코드 또는 소스 코드 수정 사항을 사용하는 데 필요한 모든 GPL, LGPL 또는 기타 유사한 라이센스의 소스 파일을 다운로드할 수 있습니다.

해결된 문제

4.5.4에서 해결된 문제

  • vsphere.local 도메인이 정의되지 않은 vCenter Server 인스턴스에 vSphere Bitfusion 4.5.3 이하 버전을 설치하면 설치 작업이 실패할 수 있음

    기본 vSphere Bitfusion 서버를 배포하는 동안 서비스 계정이 vCenter Server 인스턴스의 vsphere.local 도메인에 설치됩니다. 해당 도메인이 존재하지 않으면 설치 작업이 실패할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다. vSphere Bitfusion 4.5.4는 vCenter Server 사용자 이름에 지정된 것과 동일한 도메인을 사용하여 서비스 계정을 설치합니다.

  • vSphere Bitfusion 서버의 가상 시스템에 디스크 공간이 부족한 경우 diskspace 상태 점검에서 Marginal 또는 Fatal 상태를 보고하지 않을 수 있음

    이 문제는 이 릴리스에서 해결되었습니다. vSphere Bitfusion은 15GB 미만의 디스크 공간을 사용할 수 있는 경우 Marginal 상태를 보고하고, 10GB 미만의 디스크 공간을 사용할 수 있는 경우 Fatal 상태를 보고합니다. 

  • vSphere Bitfusion 서버에서 MTU 검사를 수행한 후 관리 네트워크 인터페이스에 대한 주의 메시지가 표시될 수 있음

    상태 점검을 실행한 후 다음과 같은 주의 메시지가 표시될 수 있습니다. Check MTU Size: 10000Mbps interface net1 has low MTU: 1500 < 4096. vSphere Bitfusion는 데이터 트래픽에 대해 구성된 네트워크 인터페이스의 MTU 크기가 9000바이트인 경우 보다 효율적으로 작동하지만 관리 트래픽에 사용되는 네트워크 인터페이스(net1)에는 1500바이트의 MTU 크기가 필요합니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 서버에서 상태 점검을 실행한 후 네트워크 안정성에 대한 주의 메시지가 표시될 수 있음

    vSphere Bitfusion이 네트워크 인터페이스에서 패킷 삭제를 감지하면 다음과 유사한 주의 메시지가 표시될 수 있습니다. Check Network Errors/Drops: drops reported in file: /sys/class/net/net1/statistics/rx_dropped. 이 문제는 이 릴리스에서 해결되었습니다.

4.5.3에서 해결된 문제

  • vCenter Server 사용자의 로그인 자격 증명이 변경된 후 vSphere Bitfusion 플러그인이 시작되지 않을 수 있음

    vSphere Bitfusion을 배포하는 동안 제품 라이센싱을 확인하기 위해 vCenter Server 사용자의 로그인 자격 증명이 필요합니다. 자격 증명이 나중에 수정되면 vSphere Bitfusion 플러그인이 시작되지 않을 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다. vSphere Bitfusion은 로그인 자격 증명을 사용하여 만료되지 않는 서비스 계정을 생성하며, 이 계정이 나중에 vSphere Bitfusion 플러그인을 인증하는 데 사용됩니다.

4.5.2에서 해결된 문제

  • 여러 사용자 역할이 있는 vCenter Server 사용자가 vSphere Bitfusion 사용자 인터페이스에 액세스할 수 없음

    vSphere Bitfusion은 vCenter Server 사용자에게 할당된 첫 번째 사용자 역할만 확인합니다. vCenter Server에 여러 사용자 역할이 할당된 사용자가 로그인을 시도하면 401 토큰 오류가 발생할 수 있으며 사용자 역할에 privilege.Bitfusion.Management.label 권한이 있더라도 vSphere Bitfusion의 사용자 인터페이스에 액세스하지 못할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion의 네트워크 성능 명령 결과가 GB/s 단위로 표시됨

    bitfusion net_perf 명령을 실행할 때 네트워크 성능이 GB/s(초당 기가바이트) 단위로 표시됩니다. 이 문제는 이번 릴리스에서 해결되었고 네트워크 속도는 네트워크 성능의 표준 측정 단위인 Gb/s(초당 기가비트) 단위로 표시됩니다.

  • 둘 이상의 네트워크 인터페이스를 동일한 네트워크에 연결할 수 없음

    둘 이상의 인터페이스가 동일한 네트워크에 연결되어 있는 다중 네트워크 인터페이스로 vSphere Bitfusion 서버를 구성하면 네트워크 라우팅 테이블이 손상되어 네트워크 경로가 없는 네트워크 인터페이스가 생성될 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 플러그인이 사용자 인터페이스에 빈 페이지를 표시할 수 있음

    vSphere Bitfusion 인터페이스를 사용하는 경우 Javascript 오류로 인해 빈 iframe이 표시될 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • 클라이언트 인증 토큰을 생성하거나 갱신한 후 새 토큰을 생성할 수 없음

    프런트 엔드 문제로 인해 토큰을 생성하거나 갱신한 후에는 새 인증 토큰을 생성하지 못할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 플러그인을 처음 실행할 때 세션 오류가 발생할 수 있음

    기본 vSphere Bitfusion을 배포한 후 vSphere Bitfusion 플러그인을 시작하면 세션 오류로 인해 인터넷 브라우저가 vSphere Bitfusion 사용자 인터페이스를 표시하지 못할 수 있습니다. 이 문제는 간헐적으로 발생할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

4.5.1에서 해결된 문제

  • vSphere Bitfusion 서버의 설치 프로세스 중에 첫 번째 네트워크가 단일 DVPG(분산 가상 포트 그룹) 네트워크 인터페이스를 사용하도록 지정되면 네트워크가 가상 시스템에 생성되지 않음

    이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 설정에서 GPU 할당량 지정이 작동하지 않음

    글로벌 클라이언트 기본값 설정에 GPU 할당량을 지정해도 vSphere Bitfusion 서버에서 GPU를 요청할 때 적용되지 않습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • 사용자로 vSphere Bitfusion 클라이언트 명령을 실행하면 오류 메시지가 표시될 수 있음

    사용자로 vSphere Bitfusion에서 클라이언트 명령을 실행할 때 다음과 같은 오류 메시지가 표시될 수 있습니다. Error: open /etc/bitfusion/tls/ca.crt: permission denied.Detail: Error: Missing credentials file. Please configure this Bitfusion client and then try again. 이 오류 메시지는 ca.crt 인증서가 vSphere Bitfusion Linux 사용자 그룹 bitfusion에 속하지 않기 때문에 나타납니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • 클라이언트 인증 토큰을 생성하거나 편집할 때 작업이 실패할 수 있음

    토큰을 생성하거나 편집하여 Kubernetes 포드에서 vSphere Bitfusion 클라이언트를 활성화하는 경우 API 오류로 인해 작업이 실패할 수 있습니다. 네임스페이스의 Kubernetes 암호가 이미 vSphere Bitfusion에 연결되어 있지만 데이터가 vSphere Bitfusion 데이터베이스에 저장되지 않았기 때문에 API가 오류 메시지를 반환합니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • 지정된 기간에 대한 vSphere Bitfusion 모니터링 데이터를 다운로드할 수 없음

    vSphere Bitfusion 플러그인의 탭에서 CSV 다운로드 버튼을 클릭하면 지정된 기간이 무시되고 다운로드된 파일에는 2일 간의 데이터가 포함됩니다. 이 문제는 이 릴리스에서 해결되었습니다.

4.5에서 해결된 문제

  • vCenter Server 업그레이드 후 vSphere Bitfusion 작동이 중지될 수 있음

    vCenter Server를 버전 7.0.2로 업그레이드한 후 vSphere Bitfusion에서 "잘못된 Bitfusion 라이센스" 오류 메시지가 표시되고 작동이 중지될 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 클라이언트가 장시간 실행된 후 vSphere Bitfusion 서버에서 연결이 끊어질 수 있음

    TCP Keepalive 설정이 올바르게 구성되지 않은 경우 vSphere Bitfusion 서버와 클라이언트 간의 연결이 중단될 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • vSphere Bitfusion 서버 가상 시스템 복제 또는 후속 vSphere Bitfusion 서버 설치 후 필수 필드가 없거나 불완전하여 새 가상 시스템을 시작할 수 없음

    vCenter Server에서 서버 가상 시스템의 복제 작업을 수행하는 동안 필수 필드가 마법사에서 필수 필드로 표시되지 않습니다. vCenter Server에서 후속 vSphere Bitfusion 서버를 설치하는 동안 필드가 잘못 지정되었을 수 있습니다. 그 결과 가상 시스템을 시작하지 못할 수 있습니다. 이 문제는 vCenter Server 7.0.3에서 해결되었습니다.

  • 가상 시스템을 복제하여 배포된 vSphere Bitfusion 서버를 클러스터에 가입시키지 못함

    vSphere Bitfusion 서버의 가상 시스템을 복제하고 복제된 다른 서버 가상 시스템을 삭제한 후에는 새로 복제된 가상 시스템을 클러스터에 가입시키지 못할 수 있습니다. 이 문제는 이 릴리스에서 해결되었습니다.

  • 소스 가상 시스템을 삭제한 후 복제된 가상 시스템을 시작할 수 없음

    vSphere Bitfusion 가상 시스템의 복제 작업 후 복제된 가상 시스템의 전원을 켜기 전에 소스 가상 시스템이 삭제되면 복제된 가상 시스템을 시작할 수 없습니다. 이 문제는 이 릴리스에서 해결되었습니다.

알려진 문제

GPU 문제

  • 가상 GPU가 지원되지 않음

    이 릴리스는 NVIDIA 가상 GPU 소프트웨어 및 NVIDIA GRID 가상 GPU 기술을 지원하지 않습니다.

vSphere Bitfusion 서버 문제

  • vSphere Bitfusion 서버를 감사할 때 일부 보안 도구에서 SSH에 사용되는 안전하지 않은 MAC 알고리즘에 대한 취약성 경고를 표시할 수 있음

    SSH 데이터 무결성 및 신뢰성은 다음 MAC 알고리즘을 사용하여 검증될 수 있습니다. umac-64-etm@openssh.com , hmac-sha1-etm@openssh.com, umac-64@openssh.com 또는 hmac-sha1. 이러한 알고리즘은 취약한 것으로 간주되며 버전 4.5.3 이상의 vSphere Bitfusion 서버가 지원하는 사용 가능한 MAC 알고리즘 목록에서 제거되었습니다.

    해결 방법: vSphere Bitfusion 서버를 버전 4.5.3 이상으로 업그레이드하십시오.

  • vSphere Bitfusion 서버에서 시간을 변경하면 클러스터 장애가 발생할 수 있음

    클러스터를 생성한 후 서버 시간이 변경되거나 시간이 동기화되지 않으면 클러스터 장애가 발생할 수 있습니다.

    해결 방법: 클러스터의 모든 vSphere Bitfusion 서버는 동일한 시간으로 동기화되어야 합니다. 클러스터의 모든 서버 시간을 동기화하고 클러스터를 다시 시작하십시오.

  • vSphere Bitfusion 클라이언트 가상 시스템의 복제 작업 후에 vSphere Bitfusion 플러그인은 소스 가상 시스템과 복제된 가상 시스템 모두에서 발생한 작업을 소스 가상 시스템에서만 발생한 것처럼 식별함

    vSphere Bitfusion 클라이언트 가상 시스템의 복제 작업 후에 vSphere Bitfusion 플러그인은 소스 가상 시스템과 복제된 가상 시스템 모두에서 발생한 작업을 소스 가상 시스템에서만 발생한 것처럼 식별합니다.

    해결 방법: 복제된 vSphere Bitfusion 클라이언트 가상 시스템의 /etc/hostname에서 호스트 이름 항목을 변경합니다.

  • vSphere Bitfusion 서버가 오프라인 상태인 경우 새 vSphere Bitfusion 서버를 클러스터에 추가할 수 없음

    클러스터에서 vSphere Bitfusion 서버 가상 시스템 하나가 오프라인 상태이면 다른 서버를 클러스터에 추가할 수 없습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • vSphere Bitfusion 플러그인을 사용하여 클러스터에서 서버를 제거합니다.

    • vSphere Client를 사용하여 게스트 운영 체제 환경 변수 guestinfo.bitfusion.server.cassandra-removenode를 서버 가상 시스템에 설정합니다.

    • 실행 중인 vSphere Bitfusion 서버의 터미널에서 bitfusion removenode 명령을 실행합니다.

  • 시간이 다른 서버로 인해 클러스터 장애가 발생할 수 있음

    DHCP를 사용하여 vSphere Bitfusion 서버의 IP 주소를 설정하고 DHCP 서버가 NTP 서버 정보를 제공하지 않거나 vSphere Bitfusion 서버의 IP 주소를 수동으로 입력하는 경우, 서버 간의 시간 차이로 인해 클러스터 장애가 발생할 수 있습니다. 모든 서버는 동일한 시간으로 동기화되어야 합니다.

    해결 방법: vCenter vApp 옵션 편집기를 사용하여 NTP 서버의 IP 주소를 하나 이상 추가합니다.

    1. vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.

    2. 가상 시스템의 전원을 끕니다.

    3. 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.

    4. 속성 아래의 목록에서 guestinfo.bitfusion.host.net1.ntp 속성을 선택하고 값 설정 버튼을 클릭합니다.

    5. 값 설정 대화상자에서 NTP 서버의 IP 주소를 하나 이상 추가합니다.

      주소가 여러 개인 경우 공백 문자로 구분합니다.

    6. 확인을 클릭합니다.

    7. 가상 시스템의 전원을 켭니다.

  • vSphere Bitfusion 서버 로그에 디스크 공간 부족에 대한 주의 메시지가 포함될 수 있음

    Apache Cassandra는 vSphere Bitfusion 서버의 사용 가능한 디스크 공간이 64GB 미만인 경우 주의 메시지(예: Only 42.645GiB free across all data volumes. Consider adding more capacity to your cluster or removing obsolete snapshots)를 표시합니다. 디스크 공간 요구 사항은 하드 코딩되어 있으며 구성에서 수정할 수 없습니다.

    해결 방법: vSphere Bitfusion 서버의 디스크 크기를 75GB 이상으로 늘립니다.

네트워킹 문제

  • PVRDMA 네트워크에서 vSphere Bitfusion과 함께 Inception V3 모듈을 사용하는 경우 간헐적인 소프트웨어 충돌이 발생할 수 있음

    PVRDMA 네트워크에서 허용되는 동시 네트워크 연결 수는 vSphere Bitfusion 서버 또는 클라이언트의 가상 시스템에서 사용할 수 있는 vCPU 수로 제한됩니다. 경우에 따라 Inception 모듈이 PVRDMA 네트워크에서 처리할 수 있는 것보다 더 많은 네트워크 연결을 열 수 있으며 이로 인해 소프트웨어 충돌이 발생할 수 있습니다.

    해결 방법: 없음.

  • DHCP를 사용하는 vSphere Bitfusion 서버를 다시 시작하는 동안 인증서 오류가 표시될 수 있음

    vSphere Bitfusion 서버의 IP 주소는 인증을 위해 vSphere Bitfusion 사용하는 X.509 인증서의 SAN(주체 대체 이름) 인증서 확장으로 사용됩니다. DHCP를 사용하는 vSphere Bitfusion 서버가 다시 시작되면 서버가 새 IP 주소를 수신할 수도 있으며 그러면 인증서 인증이 실패하여 서버가 시작되지 않을 수 있습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • vSphere Bitfusion 서버를 버전 4.5.3으로 업그레이드합니다.

    • vSphere Bitfusion 서버에 대한 정적 IP 주소를 정의합니다.

    • 새 인증 인증서를 설치합니다.

  • 인터넷 프로토콜 버전 6이 지원되지 않음

    이 릴리스에서는 IPv6가 지원되지 않습니다.

  • 복제된 vSphere Bitfusion 서버의 네트워크 어댑터를 구성할 수 없음

    vCenter Server에서 vSphere Bitfusion 서버 가상 시스템을 복제하는 동안은 추가 네트워크 어댑터에 대한 구성을 변경할 수 없습니다.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • 원래 가상 시스템을 생성하는 경우 복제된 가상 시스템에 필요한 네트워크 인터페이스를 사용하도록 설정합니다.

    • vCenter vApp 옵션 편집기를 사용하여 네트워크 설정의 값을 변경합니다. 모든 속성 목록은 vSphere Bitfusion vApp 속성을 참조하십시오.

      1. vSphere Bitfusion 서버의 가상 시스템으로 이동합니다.

      2. 구성 탭에서 설정을 확장하고 vApp 옵션을 선택합니다.

      3. 목록에서 속성을 선택하고 값 설정 버튼을 클릭합니다.

  • 후속 vSphere Bitfusion 서버의 설치 절차가 실패할 수 있음

    후속 vSphere Bitfusion 서버를 배포할 때 기본 vSphere Bitfusion 서버는 HTTPS API를 사용하여 후속 ESXi 호스트에 연결합니다. vSphere Bitfusion 서버의 관리 네트워크 인터페이스 및 ESXi 호스트의 vmx0 인터페이스에서 9000바이트의 MTU 크기를 사용 중이지만 네트워크가 두 인터페이스 간에 이 MTU 크기를 지원하지 않는 경우 HTTPS 연결이 중단되고 설치 절차가 실패할 수 있습니다.

    해결 방법:

    1. 두 인터페이스 간에 지원되는 최대 MTU 크기를 결정합니다.

      1. vSphere Bitfusion 서버의 터미널에 연결하려면 ssh customer@$server_ip를 실행합니다.

      2. 다음 셸 스크립트를 실행합니다.

        • target_host=(ESXi host IP or DNS name)
          size=1272
          while ping -s $size -M do -c1 $target_host >&/dev/null; do
          ((size+=4));
          done
          echo "Max MTU size: $((size-4+28))
    2. ​​ESXi 호스트의 vmx0 인터페이스에 대한 MTU 크기 값을 두 인터페이스 간에 지원되는 최대 MTU 크기로 변경합니다.

백업 및 복원 문제

  • 둘 이상의 서버로 구성된 vSphere Bitfusion 클러스터에서 복원 작업이 실패할 수 있음

    데이터베이스의 간헐적인 문제로 인해 Apache Cassandra 오류가 발생하여 복원 작업이 실패할 수 있습니다.

    해결 방법: 단일 서버가 있는 vSphere Bitfusion 클러스터에서 복원 작업을 수행한 다음 후속 서버를 생성합니다. 자세한 내용은 vSphere Bitfusion 업그레이드를 참조하십시오.

    1. 새 기본 vSphere Bitfusion 서버를 설치합니다.

      1. 배포 프로세스 중에 이전 기본 vSphere Bitfusion 서버에서 사용하는 것과 동일한 호스트 이름을 입력합니다.

      2. 새 VM의 설정에서 이전 기본 vSphere Bitfusion 서버에서 사용하는 것과 동일한 수의 GPU를 추가합니다.

      3. 새 VM의 고급 설정에서 guestinfo.bitfusion.server.host-id 구성 매개 변수를 추가합니다. 매개 변수 값은 manifest.json 파일에 나열된 이전 기본 서버의 호스트 ID와 일치해야 합니다.

    2. 이전 vSphere Bitfusion 클러스터의 백업을 새 클러스터로 복원합니다.

    3. 새 후속 vSphere Bitfusion 서버를 설치합니다.

      1. 배포 프로세스 중에 해당하는 이전 vSphere Bitfusion 서버의 manest.json에 나열된 호스트 이름 및 호스트 ID를 입력합니다.

      2. 새 VM의 설정에서 해당하는 이전 vSphere Bitfusion 서버에서 사용하는 것과 동일한 수의 GPU를 추가합니다.

      3. 새 VM의 설정에서 guestinfo.bitfusion.server.host-id 구성 매개 변수를 추가합니다. 매개 변수 값은 manifest.json 파일에 나열된 해당하는 이전 서버의 호스트 ID와 일치해야 합니다.

  • 현재 온라인 상태인 vSphere Bitfusion 클러스터에서 새 클러스터로 백업을 복원할 때 두 클러스터가 모두 실패할 수 있음

    복원 작업 중에 vSphere Bitfusion은 온라인 상태인 서버의 ID와 동일한 새 클러스터의 서버에 대한 호스트 ID를 생성하며 이로 인해 두 클러스터가 통신할 때 충돌이 발생합니다.

    해결 방법: 원래 클러스터가 오프라인 상태가 된 후 새 클러스터에서 복원 작업을 수행합니다.

  • vSphere Bitfusion 4.5 클러스터의 복원 작업이 실패함

    복원 작업이 완료된 후 vSphere Bitfusion 서비스가 다시 시작되지 않아서 vSphere Bitfusion 서버가 시작되지 않을 수 있습니다.

    해결 방법: vSphere Bitfusion 서비스를 다시 시작합니다.

    1. 터미널 애플리케이션을 열고 ssh customer@ip_address를 실행합니다. 여기서 ip_address는 vSphere Bitfusion 서버의 IP 주소입니다.

      vSphere Bitfusion 플러그인에서 서버 IP 주소를 가져올 수 있습니다.

    2. vSphere Bitfusion 서버를 배포하는 동안 지정한 고객 암호를 입력합니다.

    3. sudo systemctl restart bitfusion 명령을 실행하여 서비스를 다시 시작합니다.

  • vSphere Bitfusion 4.0.1 이하 클러스터에서 백업을 복원할 때 복원 작업이 실패할 수 있음

    vSphere Bitfusion 4.0.1 이하 버전에서 vSphere Bitfusion 4.5 이상 클러스터로 백업을 복원하면 복원 작업이 실패하고 다음 오류 메시지가 표시될 수 있습니다. summary error: failed to restore one or more tables: failed to restore one or more table snapshots. 이 문제는 Apache Cassandra 데이터베이스의 버전 4.0으로 내부 업데이트로 인해 발생합니다.

    해결 방법: 복원 작업을 시작하기 전에 Apache Cassandra 구성에서 enable_legacy_ssl_storage_port 매개 변수를 true로 설정합니다.

  • 복원 작업 후 vSphere Bitfusion 서버 로그에 오류 메시지가 표시될 수 있음

    복원 작업 후 "snapshotting time series" 관련 서버 로그에 오류 메시지가 표시될 수 있습니다. 오류 메시지가 표시되는 것은 복원 작업 후 이전 세션이 제대로 닫히지 않은 상태에서 vSphere Bitfusion 서비스가 다시 시작되었기 때문일 수 있습니다.

    해결 방법: 오류 메시지를 무시합니다.

  • vSphere Bitfusion 3.0 클러스터의 복원 작업이 실패함

    백업에서 다중 노드 vSphere Bitfusion 클러스터를 복원한 후 데이터 손실이 발생할 수 있으며 vSphere Bitfusion 플러그인의 글로벌 설정을 변경하지 못할 수 있습니다.

    해결 방법: 모든 vSphere Bitfusion 서버를 순차적으로 다시 시작하고 각 서버를 다시 시작한 후 60초 동안 기다립니다.

기타 문제

  • vSphere Bitfusion 장치를 배포하는 동안 vCenter Server가 잘못된 vSphere Bitfusion 인증서 주의를 보고할 수 있음

    vSphere Bitfusion 4.0 장치를 사용하여 vCenter Server 7.0.2 및 7.0.3 버전에 기본 vSphere Bitfusion 서버를 설치하는 경우 OVF 템플릿 배포 대화상자의 세부 정보 보기 페이지에 다음과 같은 주의가 표시될 수 있습니다. Invalid certificate. 이 주의는 잘못되었으며 vSphere Bitfusion 인증서가 유효합니다.

    해결 방법: 주의를 무시하고 다음을 클릭하여 OVF 템플릿 세부 정보를 확인합니다. 이 문제는 향후 vCenter Server 릴리스에서 해결됩니다.

  • [상태 로그] 대화상자의 [글로벌 기본값 일치] 버튼이 비활성화될 수 있음

    설정 > 글로벌 상태 점검 기본값 탭에서 모든 vSphere Bitfusion 서버에 대한 글로벌 상태 점검 설정을 수정하고 vSphere Bitfusion 서버의 상태 점검을 수행한 후 상태 로그 대화상자의 글로벌 기본값 일치 버튼이 비활성화될 수 있습니다. 이는 JavaScript 오류입니다.

    해결 방법: 전환 버튼을 클릭하여 상태 점검을 활성화하거나 비활성화하고 저장을 클릭합니다.

  • 빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있음

    vSphere Bitfusion 플러그인을 사용하여 후속 서버를 설치할 때 빠른 업로드 네트워크 없이 로컬 시스템에서 OVA 파일을 선택하면 실패할 수 있습니다. 일반적으로 대부분의 브라우저에는 5분의 시간 초과 제한이 있으며 vSphere Bitfusion OVA 파일 크기는 약 740MB입니다.

    해결 방법: URL에서 OVA 파일을 선택합니다.

  • CentOS 7 및 8에 설치된 vSphere Bitfusion 3.5 이하 클라이언트에서 라이브러리 오류가 발생할 수 있음

    CentOS 7 및 8용 vSphere Bitfusion 3.5 이하 클라이언트는 EPEL capstone RPM 패키지에서 설치된 libcapstone.so.3 라이브러리에 종속됩니다. capstone 패키지에는 현재 libcapstone.so.4 라이브러리만 포함되어 있습니다. vSphere Bitfusion 클라이언트가 설치된 후 클라이언트는 EPEL에서 최신 패키지를 다운로드하여 설치합니다. 이 패키지에는 최신 라이브러리가 포함되어 있으며 이로 인해 다음 오류 메시지가 표시될 수 있습니다. error while loading shared libraries: libcapstone.so.3: cannot open shared object.

    해결 방법: 다음 작업 중 하나를 수행합니다.

    • vSphere Bitfusion 서버 및 클라이언트를 버전 4.0.0 이상으로 업데이트합니다.

    • libcapstone.so.3 라이브러리가 포함된 이전 버전의 capstone 패키지를 설치합니다.

  • vSphere Bitfusion 2.5 이상 라이센스를 사용하면 vCenter Server 버전 7.0.0 이하에서 오류가 발생할 수 있음

    vCenter Server 버전 7.0.0 이하의 경우 vSphere Bitfusion은 문자열을 사용하여 vSphere Bitfusion 라이센스의 유효성을 확인합니다. 문자열이 일치하지 않으면 라이센싱 문제가 발생할 수 있습니다.

    해결 방법: vCenter Server를 버전 7.0.2 이상으로 업그레이드합니다.

check-circle-line exclamation-circle-line close-line
Scroll to top icon