Puede utilizar un adaptador de acceso de memoria directo remoto paravirtual (PVRDMA) con los servidores y clientes de vSphere Bitfusion para mejorar el rendimiento del clúster.
Una de las ventajas de ejecutar cargas de trabajo de ML e IA en vSphere Bitfusion es mantener llena la canalización de trabajo de GPU, lo que oculta la latencia de red. Dado que la canalización de GPU no siempre se puede mantener llena, se recomienda tener una conexión de red con una latencia baja de 50 microsegundos o menos.
El acceso de memoria directo remoto (RDMA) permite el acceso directo a la memoria desde la memoria de un equipo a la de otro sin involucrar al sistema operativo ni la CPU. La transferencia de memoria se descarga en un adaptador de canal de host (HCA) compatible con RDMA. Las unidades de transmisión máximas (MTU) grandes se utilizan comúnmente en redes RDMA, por ejemplo, de 9000 bytes por trama. Tanto el acceso directo como los tamaños de trama grandes reducen la sobrecarga de red y la latencia, y mejoran el rendimiento de vSphere Bitfusion.
El acceso de memoria directo remoto paravirtual (PVRDMA) permite RDMA entre máquinas virtuales a través de una red distribuida sin dedicar un adaptador físico completo a una máquina virtual mediante DirectPath I/O. Los adaptadores de red de PVRDMA proporcionan acceso remoto directo a la memoria en un entorno virtual, donde las máquinas virtuales pueden estar en el mismo host físico o en otros hosts de la misma red. Cuando no se utiliza DirectPath I/O, y hay adaptadores y conmutadores físicos compatibles con RDMA, se recomienda utilizar PVRDMA en lugar de VMXNET3.
Para obtener más información, consulte Acceso de memoria directo remoto para máquinas virtuales en la documentación de Redes de vSphere.