다음 목록은 가장 중요한 vSphere Bitfusion 명령과 해당 작업에 대한 정보를 제공합니다. 필요한 경우 VMware 지원 팀에서 추가 CLI 명령을 제공할 수 있습니다.
vSphere Bitfusion에서 GPU 할당
단일 애플리케이션에 여러 GPU를 할당하려면 bitfusion run
명령을 실행합니다.
여러 GPU를 할당하고 동일한 GPU에서 여러 애플리케이션을 실행할 수 있는 세션을 시작하려면 bitfusion request_gpus를 실행합니다.
vSphere Bitfusion에서 애플리케이션 실행
단일 애플리케이션을 시작하려면 bitfusion run
명령을 실행합니다.
bitfusion request_gpus 명령으로 시작된 세션에서 여러 애플리케이션을 시작하려면 bitfusion client 명령을 실행합니다.
vSphere Bitfusion에서 GPU 할당 해제
bitfusion request_gpus 명령으로 시작된 세션에서 GPU 할당을 해제하려면 bitfusion release_gpus 명령을 실행합니다.
vSphere Bitfusion에서 사용 가능한 GPU 나열
vSphere Bitfusion 서버 설치를 확인하고 사용 가능한 GPU 목록을 찾으려면 bitfusion list_gpus
명령을 실행합니다.
- server 0 [172.16.31.162:56001]: running 0 tasks |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5) - server 1 (leader) [172.16.31.156:56001]: running 0 tasks |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5)
vSphere Bitfusion에서 상태 점검 실행
- 모든 vSphere Bitfusion 서버 및 Bitfusion 클라이언트의 상태를 점검하려면 bitfusion health를 실행합니다.
- 단일 vSphere Bitfusion 클라이언트 또는 서버의 상태를 점검하려면 bitfusion localhealth를 실행합니다.
vSphere Bitfusion 버전 확인
설치된 vSphere Bitfusion 버전을 표시하려면 bitfusion version 명령을 실행합니다.
Bitfusion version: 4.0.0 release
vSphere Bitfusion에서 GPU 정보 표시
GPU 정보를 표시하려면 bitfusion smi 명령을 실행합니다. 또는 유사한 출력을 수신하려면 bitfusion run 명령을 사용하여 nvidia-smi 애플리케이션을 시작할 수 있습니다.
+----------------------------------------------------------------------------------------+ | 172.16.31.162:56001 Driver Version: 460.73.01 | +--------------------------------------+-------------------------+-----------------------+ | GPU Name Persistence-M | Virt Mem Alloc / All | BusId Vol Uncorr ECC | | Fan Temp Perf Pwr:Usage/Cap | Phy Mem Used / All | GPU-Util Compute M. | |======================================+=========================+=======================| | 0 Tesla T4 Enabled | 0 MB / 15109 MB | 00000000:13:00.0 0 | | 0 % 28C P8 10W / 70W | 3 MB / 15109 MB | 0% Default | +--------------------------------------+-------------------------+-----------------------+ +----------------------------------------------------------------------------------------+ | 172.16.31.156:56001 Driver Version: 460.73.01 | +--------------------------------------+-------------------------+-----------------------+ | GPU Name Persistence-M | Virt Mem Alloc / All | BusId Vol Uncorr ECC | | Fan Temp Perf Pwr:Usage/Cap | Phy Mem Used / All | GPU-Util Compute M. | |======================================+=========================+=======================| | 0 Tesla T4 Enabled | 0 MB / 15109 MB | 00000000:13:00.0 0 | | 0 % 34C P8 10W / 70W | 3 MB / 15109 MB | 0% Default | +--------------------------------------+-------------------------+-----------------------+
vSphere Bitfusion에서 대역폭 테스트
vSphere Bitfusion 클라이언트와 서버 간의 지연 시간과 대역폭을 테스트하려면 bitfusion net_perf 명령을 실행합니다.
Displayed results are calculated from round-trip measurements BW(1MB) = 1000/(LAT(1MB) - LAT(1B)) [ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s [ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s [ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s
Displayed results are calculated from round-trip measurements BW(1MB) = 1000/(LAT(1MB) - LAT(1B)) [ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s [ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s [ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s [ <client>] ens192f0 => [10.202.8.169] net2 ( tcp) Single packet lat = 47 us, bw(1MB) = 2.14 GB/s [ <client>] ens192f0 => [10.202.8.185] net2 ( tcp) Single packet lat = 49 us, bw(1MB) = 1.11 GB/s [ <client>] ens192f0 => [10.202.8.233] net2 ( tcp) Single packet lat = 50 us, bw(1MB) = 1.15 GB/s [ <client>] vmw_pvrdma0 => [10.202.8.169] vmw_pvrdma0 (infiniband) Single packet lat = 19 us, bw(1MB) = 3.66 GB/s Single packet Write lat = 8 us, bw = 10.101 GB/s [ <client>] vmw_pvrdma0 => [10.202.8.185] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.45 GB/s Single packet Write lat = 8 us, bw = 10.5263 GB/s [ <client>] vmw_pvrdma0 => [10.202.8.233] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.46 GB/s Single packet Write lat = 8 us, bw = 10.4167 GB/s
vSphere Bitfusion에서 도움말 요청
vSphere Bitfusion CLI 명령의 전체 목록 또는 특정 명령에 대한 자세한 내용을 보려면 bitfusion help 명령을 실행합니다.
NAME: Bitfusion - Run application with VMware Bitfusion USAGE: bitfusion <command> <options> "application" bitfusion <command> <options> -- [application] bitfusion help [command] For more information, system requirements, and advanced usage please visit docs.bitfusion.io COMMANDS: tls-certs, TC Manage TLS certificates used by bitfusion server. Requires root privileges. version, v Display full Bitfusion version localhealth, LH Run health check on current node only dealloc Deallocate license certificate. Requires root priviledges. crashreport Send crash report to bitfusion list_gpus List the available GPUs in a shared pool initdb Init database setup token Fetch and manipulate tokens register Register remote server as the plugin unregister Unregister remote plugin removenode Remove unavailable nodes user Manage bitfusion users help, h Shows a list of commands or help for one command Client Commands: client, c Run application health, H Run health check on all specified servers and current node request_gpus Request GPUs from a shared pool release_gpus Release GPUs back into a shared pool. Options must match a previous request_gpus command run Request GPUs from a shared pool, run a client command, then release the GPUs stats Gather stats from all servers. smi Display smi-like info for all servers. local Run a CUDA application locally net_perf Gather network performance data from all SRS servers. Server Commands: server, s Run dispatcher service - listens for 'bitfusion client' commands resource_scheduler, srs Run Bitfusion resource scheduler (SRS) on GPU server analytics Run Bitfusion analytics server manager Run Bitfusion manager server EXAMPLES: $ bitfusion resource_scheduler --srs_port 50001 $ bitfusion run -n 4 -- <application> $ bitfusion request_gpus -n 1 -p 0.25