Después de configurar un servidor y un cliente de vSphere Bitfusion para usar PVRDMA para el tráfico de datos, los puertos de RDMA del adaptador de red en el cliente de vSphere Bitfusion pueden mostrar el estado PORT_DOWN. Este problema se resuelve instalando los módulos de kernel de RDMA.

Problema

  • No se puede probar correctamente la conexión de PVRDMA entre un servidor y un cliente de vSphere Bitfusion.
  • Cuando ejecuta el comando ibv_devinfo, los puertos RDMA del cliente de vSphere Bitfusion no funcionan.

Causa

Después de instalar los paquetes de RDMA para el sistema operativo, es posible que los paquetes no instalen los módulos de kernel necesarios.

Solución

  1. Cargue los módulos de kernel mlx4_ib, ib_umad, rdma_cm, rdma_ucm y vmw_pvrdma.
    Esta solución es aplicable para CentOS, Red Hat Linux y Ubuntu.
    1. Cargue los siguientes módulos de kernel.
      sudo /sbin/modprobe mlx4_ib
      sudo /sbin/modprobe ib_umad
      sudo /sbin/modprobe rdma_cm
      sudo /sbin/modprobe rdma_ucm
    2. Vuelva a cargar el módulo de kernel vmw_pvrdma.
      Debe cargar el módulo de kernel vmw_pvrdma después de los otros módulos de kernel.
      Nota: En Ubuntu, debe realizar este paso cada vez que la máquina virtual del cliente de vSphere Bitfusion arranque.
      sudo /sbin/modprobe -r vmw_pvrdma
      sudo /sbin/modprobe vmw_pvrdma
  2. Si utiliza Ubuntu, ejecute el comando sudo update-initramfs -k all -u.
  3. (opcional) Para comprobar que los puertos RDMA de la interfaz de red funcionen, ejecute el comando ibv_devinfo.