다음 목록은 가장 중요한 vSphere Bitfusion 명령과 해당 작업에 대한 정보를 제공합니다. 필요한 경우 VMware 지원 팀에서 추가 CLI 명령을 제공할 수 있습니다.

vSphere Bitfusion에서 GPU 할당

단일 애플리케이션에 여러 GPU를 할당하려면 bitfusion run 명령을 실행합니다.

여러 GPU를 할당하고 동일한 GPU에서 여러 애플리케이션을 실행할 수 있는 세션을 시작하려면 bitfusion request_gpus를 실행합니다.

vSphere Bitfusion에서 애플리케이션 실행

단일 애플리케이션을 시작하려면 bitfusion run 명령을 실행합니다.

bitfusion request_gpus 명령으로 시작된 세션에서 여러 애플리케이션을 시작하려면 bitfusion client 명령을 실행합니다.

vSphere Bitfusion에서 GPU 할당 해제

bitfusion request_gpus 명령으로 시작된 세션에서 GPU 할당을 해제하려면 bitfusion release_gpus 명령을 실행합니다.

vSphere Bitfusion에서 사용 가능한 GPU 나열

vSphere Bitfusion 서버 설치를 확인하고 사용 가능한 GPU 목록을 찾으려면 bitfusion list_gpus 명령을 실행합니다.

 - server 0 [172.16.31.162:56001]: running 0 tasks
   |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5)
 - server 1 (leader)  [172.16.31.156:56001]: running 0 tasks
   |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5)

vSphere Bitfusion에서 상태 점검 실행

상태 점검은 명령줄에서 액세스 할 수 있습니다.
  • 모든 vSphere Bitfusion 서버 및 Bitfusion 클라이언트의 상태를 점검하려면 bitfusion health를 실행합니다.
  • 단일 vSphere Bitfusion 클라이언트 또는 서버의 상태를 점검하려면 bitfusion localhealth를 실행합니다.

vSphere Bitfusion 버전 확인

설치된 vSphere Bitfusion 버전을 표시하려면 bitfusion version 명령을 실행합니다.

Bitfusion version: 4.0.0 release

vSphere Bitfusion에서 GPU 정보 표시

GPU 정보를 표시하려면 bitfusion smi 명령을 실행합니다. 또는 유사한 출력을 수신하려면 bitfusion run 명령을 사용하여 nvidia-smi 애플리케이션을 시작할 수 있습니다.

+----------------------------------------------------------------------------------------+
| 172.16.31.162:56001                                          Driver Version: 460.73.01 |
+--------------------------------------+-------------------------+-----------------------+
| GPU  Name              Persistence-M | Virt Mem    Alloc / All | BusId  Vol Uncorr ECC |
| Fan  Temp  Perf        Pwr:Usage/Cap | Phy Mem     Used  / All | GPU-Util   Compute M. |
|======================================+=========================+=======================|
| 0    Tesla T4               Enabled  | 0       MB / 15109   MB | 00000000:13:00.0    0 |
| 0 %   28C  P8             10W /  70W | 3       MB / 15109   MB |   0%          Default |
+--------------------------------------+-------------------------+-----------------------+
+----------------------------------------------------------------------------------------+
| 172.16.31.156:56001                                          Driver Version: 460.73.01 |
+--------------------------------------+-------------------------+-----------------------+
| GPU  Name              Persistence-M | Virt Mem    Alloc / All | BusId  Vol Uncorr ECC |
| Fan  Temp  Perf        Pwr:Usage/Cap | Phy Mem     Used  / All | GPU-Util   Compute M. |
|======================================+=========================+=======================|
| 0    Tesla T4               Enabled  | 0       MB / 15109   MB | 00000000:13:00.0    0 |
| 0 %   34C  P8             10W /  70W | 3       MB / 15109   MB |   0%          Default |
+--------------------------------------+-------------------------+-----------------------+

vSphere Bitfusion에서 대역폭 테스트

vSphere Bitfusion 클라이언트와 서버 간의 지연 시간과 대역폭을 테스트하려면 bitfusion net_perf 명령을 실행합니다.

단일 네트워크 인터페이스
Displayed results are calculated from round-trip measurements
BW(1MB) = 1000/(LAT(1MB) - LAT(1B))

[ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s
[ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s
[ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s
다중 네트워크 인터페이스
Displayed results are calculated from round-trip measurements
BW(1MB) = 1000/(LAT(1MB) - LAT(1B))

[ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s
[ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s
[ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s
[ <client>] ens192f0 => [10.202.8.169] net2 ( tcp) Single packet lat = 47 us, bw(1MB) = 2.14 GB/s
[ <client>] ens192f0 => [10.202.8.185] net2 ( tcp) Single packet lat = 49 us, bw(1MB) = 1.11 GB/s
[ <client>] ens192f0 => [10.202.8.233] net2 ( tcp) Single packet lat = 50 us, bw(1MB) = 1.15 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.169] vmw_pvrdma0 (infiniband) Single packet lat = 19 us, bw(1MB) = 3.66 GB/s Single packet Write lat = 8 us, bw = 10.101 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.185] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.45 GB/s Single packet Write lat = 8 us, bw = 10.5263 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.233] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.46 GB/s Single packet Write lat = 8 us, bw = 10.4167 GB/s

vSphere Bitfusion에서 도움말 요청

vSphere Bitfusion CLI 명령의 전체 목록 또는 특정 명령에 대한 자세한 내용을 보려면 bitfusion help 명령을 실행합니다.

NAME:
   Bitfusion - Run application with VMware Bitfusion

USAGE:
   bitfusion <command> <options> "application"
   bitfusion <command> <options> -- [application]
   bitfusion help [command]

   For more information, system requirements, and advanced usage please visit docs.bitfusion.io

COMMANDS:
        tls-certs, TC    Manage TLS certificates used by bitfusion server.  Requires root privileges.
        version, v       Display full Bitfusion version
        localhealth, LH  Run health check on current node only
        dealloc          Deallocate license certificate.  Requires root priviledges.
        crashreport      Send crash report to bitfusion
        list_gpus        List the available GPUs in a shared pool
        initdb           Init database setup
        token            Fetch and manipulate tokens
        register         Register remote server as the plugin
        unregister       Unregister remote plugin
        removenode       Remove unavailable nodes
        user             Manage bitfusion users
        help, h          Shows a list of commands or help for one command
   Client Commands:
        client, c     Run application
        health, H     Run health check on all specified servers and current node
        request_gpus  Request GPUs from a shared pool
        release_gpus  Release GPUs back into a shared pool. Options must match a previous request_gpus command
        run           Request GPUs from a shared pool, run a client command, then release the GPUs
        stats         Gather stats from all servers.
        smi           Display smi-like info for all servers.
        local         Run a CUDA application locally
        net_perf      Gather network performance data from all SRS servers.
   Server Commands:
        server, s                Run dispatcher service - listens for 'bitfusion client' commands
        resource_scheduler, srs  Run Bitfusion resource scheduler (SRS) on GPU server
        analytics                Run Bitfusion analytics server
        manager                  Run Bitfusion manager server

EXAMPLES:
   $ bitfusion resource_scheduler --srs_port 50001

   $ bitfusion run -n 4 -- <application>

   $ bitfusion request_gpus -n 1 -p 0.25