PVRDMA(Paravirtual Remote Direct Memory Access) 어댑터를 vSphere Bitfusion 서버 및 클라이언트와 함께 사용하여 클러스터의 성능을 향상시킬 수 있습니다.
vSphere Bitfusion에서 ML 및 AI 워크로드를 실행할 때의 이점 중 하나는 GPU 작업의 파이프라인을 채워진 상태로 유지하여 네트워크 지연 시간을 숨길 수 있다는 것입니다. GPU 파이프라인이 항상 가득 찬 상태로 유지될 수는 없으므로 지연 시간이 50마이크로초 이하인 네트워크 연결을 유지하는 것이 좋습니다.
RDMA(Remote Direct Memory Access)를 사용하면 운영 체제 또는 CPU의 관여 없이 한 컴퓨터 메모리에서 다른 컴퓨터 메모리로 직접 메모리 액세스가 가능합니다. 메모리 전송은 RDMA 지원 HCA(호스트 채널 어댑터)에 오프로드됩니다. 대형 MTU(최대 전송 단위)는 일반적으로 RDMA 네트워킹에서 사용됩니다(예: 프레임당 9000바이트). 직접 액세스 및 큰 프레임 크기는 네트워크 오버헤드와 지연 시간을 줄이고 vSphere Bitfusion의 성능을 향상시킵니다.
PVRDMA(Paravirtual Remote Direct Memory Access)를 사용하면 DirectPath I/O를 사용하여 전체 물리적 어댑터를 VM에 전용으로 할당하지 않고도 분산 네트워크를 통해 VM(가상 시스템) 간에 RDMA를 수행할 수 있습니다. PVRDMA 네트워크 어댑터는 VM이 동일한 물리적 호스트에 있거나 동일 네트워크의 다른 호스트에 있을 수 있는 가상 환경에서 원격 직접 메모리 액세스를 제공합니다. DirectPath I/O를 사용하지 않고 물리적 RDMA 지원 어댑터 및 스위치를 사용할 수 있는 경우 VMXNET3 대신 PVRDMA를 사용하는 것이 좋습니다.
자세한 내용은 "vSphere 네트워킹" 설명서에서 "가상 시스템에 대한 RDMA" 를 참조하십시오.