데이터 트래픽에 PVRDMA를 사용하도록 vSphere Bitfusion 서버 및 클라이언트를 구성한 후 vSphere Bitfusion 클라이언트에 있는 네트워크 어댑터의 RDMA 포트가 PORT_DOWN
상태를 표시할 수 있습니다. RDMA 커널 모듈을 설치하여 이 문제를 해결합니다.
문제
- vSphere Bitfusion 서버와 클라이언트 간의 PVRDMA 연결을 성공적으로 테스트할 수 없습니다.
- ibv_devinfo 명령을 실행할 때 vSphere Bitfusion 클라이언트의 RDMA 포트가 작동하지 않습니다.
원인
운영 체제에 대한 RDMA 패키지를 설치한 후 패키지가 필요한 커널 모듈을 설치하지 않을 수 있습니다.
해결책
-
mlx4_ib
, ib_umad
, rdma_cm
, rdma_ucm
및 vmw_pvrdma 커널 모듈을 로드합니다.
이 솔루션은 CentOS, Red Hat Linux 및 Ubuntu에 적용됩니다.
- 다음 커널 모듈을 로드합니다.
sudo /sbin/modprobe mlx4_ib
sudo /sbin/modprobe ib_umad
sudo /sbin/modprobe rdma_cm
sudo /sbin/modprobe rdma_ucm
- vmw_pvrdma 커널 모듈을 다시 로드합니다.
다른 커널 모듈 다음에
vmw_pvrdma 커널 모듈을 로드해야 합니다.
참고: Ubuntu에서는
vSphere Bitfusion 클라이언트의 가상 시스템이 부팅될 때마다 이 단계를 수행해야 합니다.
sudo /sbin/modprobe -r vmw_pvrdma
sudo /sbin/modprobe vmw_pvrdma
- Ubuntu를 사용하는 경우 sudo update-initramfs -k all -u 명령을 실행합니다.
- (선택 사항) 네트워크 인터페이스의 RDMA 포트가 작동하는지 확인하려면 ibv_devinfo 명령을 실행합니다.