Die folgende Liste enthält Informationen zu den wichtigsten vSphere Bitfusion-Befehlen und den zugehörigen Aufgaben. Zusätzliche CLI-Befehle können gegebenenfalls vom VMware Support-Team bereitgestellt werden.

Zuteilen von GPUs in vSphere Bitfusion

Führen Sie den Befehl bitfusion run aus, um eine Anzahl von GPUs für eine einzelne Anwendung zuzuteilen.

Führen Sie den Befehl bitfusion request_gpus aus, um eine Anzahl von GPUs zuzuteilen und eine Sitzung zu starten, in der mehrere Anwendungen auf denselben GPUs ausgeführt werden können.

Ausführen von Anwendungen in vSphere Bitfusion

Führen Sie den Befehl bitfusion run aus, um eine einzelne Anwendung zu starten.

Zum Aufrufen mehreren Anwendungen in einer mit dem Befehl bitfusion request_gpus gestarteten Sitzung führen Sie den Befehl bitfusion client aus.

Aufheben der Zuteilung von GPUs in vSphere Bitfusion

Zum Aufheben der Zuteilung von GPUs in einer mit dem Befehl bitfusion request_gpus gestarteten Sitzung führen Sie den Befehl bitfusion release_gpus aus.

Auflisten verfügbare GPUs in vSphere Bitfusion

Zum Überprüfen einer vSphere Bitfusion-Serverinstallation und Auffinden einer Liste mit verfügbaren GPUs führen Sie den Befehl bitfusion list_gpus aus.

 - server 0 [172.16.31.162:56001]: running 0 tasks
   |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5)
 - server 1 (leader)  [172.16.31.156:56001]: running 0 tasks
   |- GPU [0]: free memory (15109 / 15109MiB) Tesla T4 (7.5)

Durchführen einer Integritätsprüfung in vSphere Bitfusion

Sie können über die Befehlszeile auf die Integritätsprüfung zugreifen.
  • Zum Überprüfen der Integrität aller vSphere Bitfusion-Server und des Bitfusion-Clients führen Sie bitfusion health aus.
  • Um den Systemzustand eines einzelnen vSphere Bitfusion-Clients oder -Servers zu überprüfen, führen Sie bitfusion localhealth aus.

Überprüfen der vSphere Bitfusion-Version

Um die installierte Version von vSphere Bitfusion anzuzeigen, führen Sie den Befehl bitfusion version aus.

Bitfusion version: 4.0.0 release

Anzeigen von GPU-Informationen in vSphere Bitfusion

Führen Sie zum Anzeigen von GPU-Informationen den Befehl bitfusion smi aus. Alternativ können Sie die Anwendung nvidia-smi mit dem Befehl bitfusion run starten, um eine ähnliche Ausgabe zu erhalten.

+----------------------------------------------------------------------------------------+
| 172.16.31.162:56001                                          Driver Version: 460.73.01 |
+--------------------------------------+-------------------------+-----------------------+
| GPU  Name              Persistence-M | Virt Mem    Alloc / All | BusId  Vol Uncorr ECC |
| Fan  Temp  Perf        Pwr:Usage/Cap | Phy Mem     Used  / All | GPU-Util   Compute M. |
|======================================+=========================+=======================|
| 0    Tesla T4               Enabled  | 0       MB / 15109   MB | 00000000:13:00.0    0 |
| 0 %   28C  P8             10W /  70W | 3       MB / 15109   MB |   0%          Default |
+--------------------------------------+-------------------------+-----------------------+
+----------------------------------------------------------------------------------------+
| 172.16.31.156:56001                                          Driver Version: 460.73.01 |
+--------------------------------------+-------------------------+-----------------------+
| GPU  Name              Persistence-M | Virt Mem    Alloc / All | BusId  Vol Uncorr ECC |
| Fan  Temp  Perf        Pwr:Usage/Cap | Phy Mem     Used  / All | GPU-Util   Compute M. |
|======================================+=========================+=======================|
| 0    Tesla T4               Enabled  | 0       MB / 15109   MB | 00000000:13:00.0    0 |
| 0 %   34C  P8             10W /  70W | 3       MB / 15109   MB |   0%          Default |
+--------------------------------------+-------------------------+-----------------------+

Testen der Bandbreite in vSphere Bitfusion

Führen Sie zum Testen der Bandbreite und Latenz zwischen dem vSphere Bitfusion-Client und den Servern den Befehl bitfusion net_perf aus.

Einzelne Netzwerkschnittstelle
Displayed results are calculated from round-trip measurements
BW(1MB) = 1000/(LAT(1MB) - LAT(1B))

[ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s
[ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s
[ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s
Mehrere Netzwerkschnittstellen
Displayed results are calculated from round-trip measurements
BW(1MB) = 1000/(LAT(1MB) - LAT(1B))

[ <client>] ens160 => [10.202.8.169] net1 ( tcp) Single packet lat = 51 us, bw(1MB) = 1.71 GB/s
[ <client>] ens160 => [10.202.8.185] net1 ( tcp) Single packet lat = 48 us, bw(1MB) = 1.09 GB/s
[ <client>] ens160 => [10.202.8.233] net1 ( tcp) Single packet lat = 50 us, bw(1MB) = 0.87 GB/s
[ <client>] ens192f0 => [10.202.8.169] net2 ( tcp) Single packet lat = 47 us, bw(1MB) = 2.14 GB/s
[ <client>] ens192f0 => [10.202.8.185] net2 ( tcp) Single packet lat = 49 us, bw(1MB) = 1.11 GB/s
[ <client>] ens192f0 => [10.202.8.233] net2 ( tcp) Single packet lat = 50 us, bw(1MB) = 1.15 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.169] vmw_pvrdma0 (infiniband) Single packet lat = 19 us, bw(1MB) = 3.66 GB/s Single packet Write lat = 8 us, bw = 10.101 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.185] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.45 GB/s Single packet Write lat = 8 us, bw = 10.5263 GB/s
[ <client>] vmw_pvrdma0 => [10.202.8.233] vmw_pvrdma0 (infiniband) Single packet lat = 21 us, bw(1MB) = 3.46 GB/s Single packet Write lat = 8 us, bw = 10.4167 GB/s

Anfordern von Hilfe in vSphere Bitfusion

Zum Abrufen der vollständigen Liste der Befehle in der vSphere Bitfusion-CLI oder weiterer Informationen zu einem bestimmten Befehl führen Sie den Befehl bitfusion help aus.

NAME:
   Bitfusion - Run application with VMware Bitfusion

USAGE:
   bitfusion <command> <options> "application"
   bitfusion <command> <options> -- [application]
   bitfusion help [command]

   For more information, system requirements, and advanced usage please visit docs.bitfusion.io

COMMANDS:
        tls-certs, TC    Manage TLS certificates used by bitfusion server.  Requires root privileges.
        version, v       Display full Bitfusion version
        localhealth, LH  Run health check on current node only
        dealloc          Deallocate license certificate.  Requires root priviledges.
        crashreport      Send crash report to bitfusion
        list_gpus        List the available GPUs in a shared pool
        initdb           Init database setup
        token            Fetch and manipulate tokens
        register         Register remote server as the plugin
        unregister       Unregister remote plugin
        removenode       Remove unavailable nodes
        user             Manage bitfusion users
        help, h          Shows a list of commands or help for one command
   Client Commands:
        client, c     Run application
        health, H     Run health check on all specified servers and current node
        request_gpus  Request GPUs from a shared pool
        release_gpus  Release GPUs back into a shared pool. Options must match a previous request_gpus command
        run           Request GPUs from a shared pool, run a client command, then release the GPUs
        stats         Gather stats from all servers.
        smi           Display smi-like info for all servers.
        local         Run a CUDA application locally
        net_perf      Gather network performance data from all SRS servers.
   Server Commands:
        server, s                Run dispatcher service - listens for 'bitfusion client' commands
        resource_scheduler, srs  Run Bitfusion resource scheduler (SRS) on GPU server
        analytics                Run Bitfusion analytics server
        manager                  Run Bitfusion manager server

EXAMPLES:
   $ bitfusion resource_scheduler --srs_port 50001

   $ bitfusion run -n 4 -- <application>

   $ bitfusion request_gpus -n 1 -p 0.25