VMware vSphere Bitfusion は、グラフィック処理ユニット (GPU) などのハードウェア アクセラレータを仮想化することで、人工知能 (AI) や機械学習 (ML) のワークロードをサポートするネットワーク アクセス可能な共有リソースのプールを提供します。

vSphere Bitfusion のアーキテクチャとは

vSphere Bitfusion は、クライアント/サーバ アーキテクチャを採用しています。この製品を使用すると、人工知能 (AI) および機械学習 (ML) のアプリケーションを実行している複数のクライアント仮想マシン (VM) が、vSphere Bitfusion サーバ ソフトウェアを実行している仮想マシン上のリモート GPU へのアクセスを共有できます。アプリケーションは vSphere Bitfusion クライアント マシン上で実行しますが、アクセラレーションを提供する GPU はネットワーク経由で vSphere Bitfusion サーバ マシンにインストールされています。アプリケーションは、ローカル GPU を搭載したマシンで動作する場合と同様に、ファイルを開いたり、メモリの割り当てと CUDA の呼び出しを実行したりできます。

次の図は小規模な vSphere Bitfusion クラスタの例であり、スイッチングされるネットワーク上の vSphere Bitfusion サーバ/クライアント マシンのセットと vCenter Server が示されています。最小の vSphere Bitfusion クラスタ構成は、1 台のクライアント、1 台のサーバ、および 1 台の vCenter Server です。複数のサーバとクライアントを使用して、大規模なクラスタを作成できます。

図 1. 小規模 vSphere Bitfusion クラスタの例
3 台のサーバと 2 台のクライアントを含む小規模 vSphere Bitfusion クラスタの図。すべてのコンポーネントが同じ vCenter Server インスタンスに接続されています。
注: VMware vSphere Bitfusion を使用する前に、 vSphere Bitfusion サーバをデプロイし、クライアント マシンに vSphere Bitfusion ソフトウェアをインストールして有効にする必要があります。詳細については、『 VMware vSphere Bitfusion インストール ガイド』の「 vSphere Bitfusion インストール プロセスの概要」を参照してください。

vSphere Bitfusion の仕組み

vSphere Bitfusion クライアントで AI または ML アプリケーションを起動すると、vSphere Bitfusion はアプリケーションの CUDA 呼び出しを傍受し、呼び出しのデータとデータ ポインタを認識します。アプリケーション データが保持されるストレージに vSphere Bitfusion サーバを接続する必要はありません。接続する必要があるのは vSphere Bitfusion クライアントのみです。クライアントは、データと残りの CUDA 呼び出しをサーバに転送します。vSphere Bitfusion サーバは呼び出しを処理し、結果をクライアントに返します。

vSphere Bitfusion で AI および ML アプリケーションを起動するときに、GPU リソースを共有することができます。

  • GPU リソースを動的に割り当てて、vSphere Bitfusion サーバからアクセスすることができます。

    複数のアプリケーションで、ローカル マシンにインストールされていない GPU リソースを共有することができます。また、仮想マシン、ベアメタル マシン、コンテナなど、適切な環境内に構成された vSphere Bitfusion クライアント上で各アプリケーションを実行することができます。アプリケーションは、ネットワーク全体の vSphere Bitfusion サーバのプールから GPU アクセラレーション サービスを使用し、アプリケーションまたはセッションが実行されている間だけ、リソースを使用します。GPU は、アプリケーションまたはセッションが完了すると、プールに戻されます。

  • 他のアプリケーションとの同時共有のために、GPU リソースのパーティションにアクセスすることができます。

    物理 GPU のメモリは、任意のサイズの部分に分割できます。各部分をそれぞれ異なるアプリケーションに同時に割り当てることができます。vSphere Bitfusion は、割り込みテクノロジーとの共有に対応しています。通常は PCIe ホスト バス上のローカル アクセラレータを対象にする API 呼び出しに vSphere Bitfusion が割り込み、API 呼び出しと関連データをネットワーク経由で送信します。vSphere Bitfusion は、AI および ML アプリケーション用の共有サービスを提供し、NVIDIA GPU をターゲットとする CUDA API をサポートします。

vSphere Bitfusion の主なコンポーネントについて

vSphere Bitfusion サーバとは
vSphere Bitfusion サーバは、GPU がローカルにインストールされている ESXi ホストで VMware アプライアンスとして実行されます。これは、事前にパッケージ化されたソフトウェアとサービスによる、事前構成済みの仮想マシン (VM) です。サーバは、通常は VMware vSphere ® DirectPath I/O™ を通じて、ローカル GPU にアクセスできる必要があります。
vSphere Bitfusion クライアントとは
vSphere Bitfusion クライアントは、AI および ML のアプリケーションを実行する仮想マシンで実行されます。
vSphere Bitfusion プラグインとは
vSphere Bitfusion サーバは、 vSphere Bitfusion プラグインを VMware vCenter Server に登録します。このプラグインを使用すると、 vSphere Bitfusion のクライアントとサーバの監視と管理が可能になります。
vSphere Bitfusion クラスタとは
vSphere Bitfusion クラスタは、 vCenter Server インスタンスのすべての vSphere Bitfusion サーバとクライアントのセットです。
vSphere Bitfusion Linux ユーザー グループとは
vSphere Bitfusion クライアントのインストール時に、クライアントは vSphere Bitfusion Linux ユーザー グループ bitfusion を作成します。 vSphere Bitfusion は、グループのメンバーのみが使用できます。特定の構成ファイルに適切な権限が設定されており、グループのメンバーは、 vSphere Bitfusion で効果的に作業できるように、適切な制限を継承します。
vSphere Client とは
vSphere Client を使用すると、Web ブラウザを使用して vCenter Server インスタンスに接続し、vSphere インフラストラクチャを管理できます。 vSphere Client を通じて、 vSphere Bitfusion プラグインにアクセスします。
コマンドライン インターフェイス (CLI) とは
コマンドライン インターフェイス (CLI) コマンドを使用して、 vSphere Bitfusion サーバとクライアントを管理できます。
vCenter Server とは
vCenter Server は、vSphere 環境を制御するための一元化されたプラットフォームを提供するサーバ管理ソフトウェアです。

vSphere Bitfusion に関する FAQ

vSphere Bitfusion の詳細については、Cloud Platform Tech Zoneよくある質問 (FAQ)セクションを参照してください。