VMware vSphere Bitfusion は、グラフィック処理ユニット (GPU) などのハードウェア アクセラレータを仮想化することで、人工知能 (AI) や機械学習 (ML) のワークロードをサポートするネットワーク アクセス可能な共有リソースのプールを提供します。vSphere Bitfusion は、TensorFlow や PyTorch などの人工知能フレームワークと連携します。データセンター環境で使用するために、仮想マシンまたは Docker コンテナ内に vSphere Bitfusion をデプロイできます。vSphere Bitfusion を使用すると、ネットワーク内のすべての GPU サーバの健全性、使用率、効率、可用性を監視できます。GPU のクライアント使用量を監視し、容量と時間制限を割り当てることもできます。

vSphere Bitfusion が GPU 仮想化を拡張する方法について説明している vSphere の図。

vSphere Bitfusion の現在のリリースについては、最新の VMware vSphere Bitfusion リリース ノートを参照してください。

vSphere Bitfusion 機能の概要

vSphere Bitfusion の基本概念と、GPU の仮想化と、AI や ML アプリケーションで使用する共有コンピューティング リソースのプールを提供する方法について学習します。

vSphere Bitfusion の実行に必要なソフトウェアとハードウェアの要件など、vSphere 環境に vSphere Bitfusion サーバとクライアントをインストールする方法について学習します。

vSphere Bitfusion プラグインを使用してクラスタに後続の vSphere Bitfusion サーバを追加する方法について学習します。

複数の vCenter Server インスタンスまたは Kubernetes クラスタでvSphere Bitfusion クライアントを有効にする方法について説明します。

vSphere Bitfusion のインストール プロセスが正常に完了したことを確認するには、展開をテストします。

準仮想化 RDMA (PVRDMA) アダプタを使用して、vSphere Bitfusion 環境のパフォーマンスを向上させることができます。RDMA を使用すると、アプリケーションはコンピュータのメモリから別のコンピュータのメモリに、オペレーティング システムや CPU を介さずに直接アクセスすることができます。

現在のクラスタ構成と監視データを損なうことなく、vSphere Bitfusion クラスタをアップグレードすることができます。

ネットワーク インターフェイスを追加、削除、および変更して、vSphere Bitfusion サーバを複数のネットワークに接続する方法について学習します。

vSphere Bitfusion クライアントにラベルを追加して、ワークロードを識別できます。

すべての vSphere Bitfusion サーバおよびクライアントに対する証明書の更新方法について学習します。

vSphere Bitfusion アプリケーションの起動と停止方法と、同じ GPU で複数のアプリケーションを実行するように GPU を割り当てる方法について学習します。GPU またはサーバの固有のセットに対して AI および ML ワークロードを実行することもできます。

ネットワークの MTU フレーム サイズのテストvSphere Bitfusion で行うことができます。

vSphere Bitfusion が使用量データの詳細やサマリを保持する期間を構成することができます。データをダウンロードするには、メトリック REST API を使用します。

健全性チェックを実行することで、vSphere Bitfusion サーバのパフォーマンス、安定性、使用可能なシステム リソース、ソフトウェア バージョンを確認できます。また、vSphere Bitfusion サーバ専用のログ ファイルを調べることで、vSphere Bitfusion 環境のトラブルシューティングを行うこともできます。

vSphere Client 内の vSphere Bitfusion プラグインによって提供されるグラフィカル ユーザー インターフェイスを使用して、vSphere Bitfusion を監視する方法について学習します。vSphere Bitfusion サーバとクライアントの GPU の割り当てと使用量、メモリ使用量、ネットワーク トラフィックの統計情報などのデータの現在値および履歴を表示できます。また、.csv ファイルに監視データをエクスポートおよびダウンロードして、vSphere Bitfusion 環境の確認とトラブルシューティングを行うこともできます。

監視プラグイン パッケージを使用して、クラスタ内のvSphere Bitfusion サーバを監視する方法について説明します。このパッケージには、Icinga、Naemon、Nagios、Sinken、Sensu などの監視アプリケーションの標準プラグインが 50 以上含まれています。

vSphere Bitfusion データベースのバックアップリストアの方法について学習します。データベースをバックアップすることで、vSphere Bitfusion クラスタのデータの構成、接続、健全性の状態、履歴のスナップショットを保存できます。障害が発生した場合は、vSphere Bitfusion データベースをリストアし、スナップショットを使用してクラスタをリカバリできます。

vSphere Bitfusion への AI および ML アプリケーションのインストールおよび実行方法と、ベンチマークとテストを実行して vSphere Bitfusion デプロイのパフォーマンスを測定する方法について説明します。TensorFlow、PyTorch、YOLO を使用するには、NVIDIA CUDA および NVIDIA CUDA ディープ ニューラル ネットワーク ライブラリ (cuDNN) もインストールします。CUDA は、NVIDIA によって開発された、GPU で一般的なコンピューティングを実現するコンピューティング ライブラリです。cuDNN は、ディープ ニューラル ネットワークでの使用を目的とした、GPU アクセラレーション型のプリミティブのライブラリです。

vSphere Bitfusion のダウンロード

デプロイを開始するには、vSphere Bitfusion アプライアンスとクライアント ソフトウェアのパッケージをダウンロードします。

ビデオの参照

ドキュメントや VMware vSphere YouTube チャンネルのビデオによって、vSphere Bitfusion の展開および操作について学習することができます。

vSphere Bitfusion の詳細情報

vSphere Bitfusion および GPU の仮想化の詳細については、次のリソースを参照してください。
  • vSphere Bitfusion の詳細については、vSphere Bitfusion のソリューションおよびCloud Platform Tech Zoneを参照してください。
  • 機械学習のためのエンドツーエンドのオープン ソース プラットフォームである TensorFlow について説明しています。TensorFlow により、デスクトップ、モバイル、Web、クラウド環境向けの機械学習モデルの作成が簡素化されます。
  • PyTorchおよびYOLOについて説明します。PyTorch を使用して、YOLO に基づくオブジェクト ディテクタを実装できます。YOLO は、オブジェクトの検出に深層畳み込みニューラル ネットワークによって学習される機能を使用するオブジェクト ディテクタです。
  • vSphere Bitfusion は、GPU で一般的なコンピューティングを実現するために NVIDIA によって開発された並列コンピューティング プラットフォームである CUDA と統合されています。CUDA を使用すると、GPU の機能を活用することで、コンピューティング アプリケーションを大幅に高速化できます。CUDA を使用して開発されたアプリケーションは、組み込みシステム、ワークステーション、データセンター、クラウド内の GPU に展開されています。
  • ディープ ニューラルネットワークで使用されるプリミティブの GPU アクセラレーション ライブラリである NVIDIA cuDNNvSphere Bitfusion と連携して GPU のパフォーマンスを加速させる方法について学習します。この連携により、低レベルの GPU パフォーマンス調整に時間をかけずにニューラル ネットワークのトレーニングやソフトウェア アプリケーションの開発に注力できます。

vSphere Bitfusion のドキュメントを使用する

vSphere Bitfusion の HTML 形式のドキュメントには、vSphere Bitfusion の各メジャー バージョンの最新の アップデート リリースの内容が反映されています。たとえば、バージョン 2.5 には、2.5.x リリースのすべてのアップデートが含まれています。

MyLibrary を使用して、特定の情報を求めるニーズに合ったコンテンツのみを含むカスタム ドキュメントのコレクションを作成できます。