데이터 트래픽에 PVRDMA를 사용하도록 vSphere Bitfusion 서버 및 클라이언트를 구성한 후 vSphere Bitfusion 클라이언트에 있는 네트워크 어댑터의 RDMA 포트가 PORT_DOWN 상태를 표시할 수 있습니다. RDMA 커널 모듈을 설치하여 이 문제를 해결합니다.

문제

  • vSphere Bitfusion 서버와 클라이언트 간의 PVRDMA 연결을 성공적으로 테스트할 수 없습니다.
  • ibv_devinfo 명령을 실행할 때 vSphere Bitfusion 클라이언트의 RDMA 포트가 작동하지 않습니다.

원인

운영 체제에 대한 RDMA 패키지를 설치한 후 패키지가 필요한 커널 모듈을 설치하지 않을 수 있습니다.

해결책

  1. mlx4_ib, ib_umad, rdma_cm, rdma_ucmvmw_pvrdma 커널 모듈을 로드합니다.
    이 솔루션은 CentOS, Red Hat Linux 및 Ubuntu에 적용됩니다.
    1. 다음 커널 모듈을 로드합니다.
      sudo /sbin/modprobe mlx4_ib
      sudo /sbin/modprobe ib_umad
      sudo /sbin/modprobe rdma_cm
      sudo /sbin/modprobe rdma_ucm
    2. vmw_pvrdma 커널 모듈을 다시 로드합니다.
      다른 커널 모듈 다음에 vmw_pvrdma 커널 모듈을 로드해야 합니다.
      참고: Ubuntu에서는 vSphere Bitfusion 클라이언트의 가상 시스템이 부팅될 때마다 이 단계를 수행해야 합니다.
      sudo /sbin/modprobe -r vmw_pvrdma
      sudo /sbin/modprobe vmw_pvrdma
  2. Ubuntu를 사용하는 경우 sudo update-initramfs -k all -u 명령을 실행합니다.
  3. (선택 사항) 네트워크 인터페이스의 RDMA 포트가 작동하는지 확인하려면 ibv_devinfo 명령을 실행합니다.