VMware vSphere Bitfusion 4.0 | 2021 年 8 月 17 日 | ビルド 13 VMware vSphere Bitfusion 4.0.1 | 2021 年 9 月 16 日 | ビルド 5 各リリース ノートで、追加および更新された機能をご確認ください。 |
新機能
リリース ノートの概要
本リリース ノートには、次のトピックが含まれています。
- vSphere Bitfusion について
- vSphere Bitfusion 4.0 の新機能
- システム要件
- 互換性と相互運用性
- オープン ソースのコンポーネント
- 解決した問題
- 既知の問題
vSphere Bitfusion について
VMware vSphere Bitfusion は、グラフィック処理ユニット (GPU) などのアクセラレータを共有して、リソースを大量に使用する人工知能 (AI) および機械学習 (ML) のワークロードをサポートする共有ネットワーク アクセス可能なリソース プールを提供します。vSphere Bitfusion は、AI フレームワーク、クラウド サイト、ネットワークのいずれでも仮想マシン、コンテナ、ノートブックなどの環境で動作します。
vSphere Bitfusion 4.0 の新機能
- 特定の GPU または vSphere Bitfusion サーバのセットでワークロードを実行するスケジュール設定の機能を強化しました。
- vSphere Bitfusion の履歴データを格納する期間を指定するためのデータ保持ポリシーを追加しました。
- vSphere Bitfusion サーバのステータスを判断するための監視プラグインを追加しました。
- クライアント認証トークンを、vSphere Bitfusion から Kubernetes シークレットに発行できます。
- vCenter Server のダーク テーマが vSphere Bitfusion でサポートされるようになりました。
- Ubuntu 16.04 クライアントのサポートは、vSphere Bitfusion 4.0.0 で削除されました。
- vSphere Bitfusion 2.x.x クライアントのサポートは廃止されていて、今後の vSphere Bitfusion リリースで削除される予定です。
システム要件
vSphere Bitfusion クライアントとサーバのシステム要件のリストについては、『vSphere Bitfusion インストール ガイド』を参照してください。
互換性と相互運用性
vSphere Bitfusion と互換性のあるバージョン、モデル、製品のリストについては、「VMware vSphere Bitfusion の互換性および相互運用性」ページを参照してください。
オープン ソースのコンポーネント
vSphere Bitfusion 3.5 で配布されているオープン ソース ソフトウェア コンポーネントに適用される著作権情報およびライセンスは、http://www.vmware.com を参照してください。入手可能な vSphere Bitfusion の最新リリースで利用できるようにするためにソース コードやソース コードへの改変が必要になる GPL、LGPL などのライセンスのソース ファイルをダウンロードすることができます。
解決した問題 4.0.1
-
vSphere Bitfusion サーバが GPU API の不一致と GPU Xid エラーを報告することがある
vSphere Bitfusion サーバで、
bitfusion user
としてbitfusion localhealth
コマンドを実行すると、サーバが GPU API の不一致と GPU Xid エラーを報告することがあります。本リリースで、この問題は修正されました。 -
vSphere Bitfusion クライアントが vSphere Bitfusion サーバに接続できない
クライアント認証トークンを使用して vSphere Bitfusion クライアントが有効にされ、クライアントがサーバとは異なるサブネットワークを使用している場合、クライアントは vSphere Bitfusion サーバに接続できません。本リリースで、この問題は修正されました。
-
vSphere Bitfusion サーバのグローバルの健全性チェック設定をデフォルト設定にすると、操作が失敗することがある
本リリースで、この問題は修正されました。
-
vSphere Bitfusion サーバの無効にしたグローバル健全性チェックを有効にすると、操作が失敗することがある
本リリースで、この問題は修正されました。
解決した問題 3.5
-
後続の vSphere Bitfusion サーバのデプロイ時に GPU メモリを指定できない
本リリースで、この問題は修正されました。vSphere Bitfusion プラグインを使用して後続のサーバをインストールする際に、[GPU の選択] 画面で GPU メモリの合計を指定しても、vSphere Bitfusion サーバの仮想マシンのメモリと MMIO のサイズが推奨されます。
解決した問題 3.0.1
-
vSphere Bitfusion プラグインを使用して後続のサーバをインストールすると、プライマリ ネットワークには標準ネットワークのみが使用可能になる
本リリースで、この問題は修正されました。プライマリ ネットワークは、VMXNET3 または PVRDMA アダプタを使用する分散ポート グループに設定できます。
-
CUDA 11.1 サンプル テストにより、cuModuleGetGlobal_v2 モジュールに障害が発生することがある
本リリースで、この問題は修正されました。
既知の問題:GPU の問題
-
仮想 GPU はサポート対象外
本リリースでは、NVIDIA 仮想 GPU ソフトウェアおよび NVIDIA GRID 仮想 GPU テクノロジーはサポートされません。
-
1 つの GPU が vCenter Server で複数回表示されることがある
NVIDIA T4 GPU が vCenter Server で複数回表示されることがあります。
回避策:ESXi ホストの BIOS 設定で、SR-IOV サポートを有効にします。
既知の問題:vSphere Bitfusion サーバの問題
-
vSphere Bitfusion クライアントの仮想マシンのクローン作成操作後、vSphere Bitfusion プラグインが、ソース仮想マシンとクローン仮想マシンの両方から発生するアクティビティを、ソース仮想マシンからのみ発生しているように識別します。
vSphere Bitfusion クライアントの仮想マシンのクローン作成操作後、vSphere Bitfusion プラグインが、ソース仮想マシンとクローン仮想マシンの両方から発生するアクティビティを、ソース仮想マシンからのみ発生しているように識別します。
回避策:クローン作成された vSphere Bitfusion クライアントの仮想マシンの
/etc/hostname
で、ホスト名のエントリを変更します。 -
vSphere Bitfusion サーバの時刻を変更すると、クラスタで障害が発生することがある
クラスタが作成された後にサーバの時刻が変更された場合、または同期されていない場合、クラスタが失敗することがあります。
回避策:クラスタ内のすべての vSphere Bitfusion サーバを同じ時刻に同期させる必要があります。クラスタ内のすべてのサーバの時刻を同期して、再起動します。
-
サーバ間で時刻が異なっている場合、クラスタに障害が発生することがある
DHCP を使用して vSphere Bitfusion サーバの IP アドレスを設定した際に、DHCP サーバが NTP サーバ情報を提供しなかった場合、または vSphere Bitfusion サーバの IP アドレスを手動で入力した場合、サーバ間の時間差が原因でクラスタに障害が発生することがあります。すべてのサーバを同じ時刻に同期させる必要があります。
回避策:サーバの構成で、NTP サーバの IP アドレスを追加します。
-
仮想マシンのクローン作成によってデプロイされた vSphere Bitfusion サーバがクラスタに参加できない
vSphere Bitfusion サーバの仮想マシンをクローン作成して、クローン作成された別のサーバ仮想マシンを削除すると、新しくクローン作成された仮想マシンがクラスタに参加できないことがあります。
-
vSphere Bitfusion サーバがオフラインの場合、クラスタに新しい vSphere Bitfusion サーバを追加できない
クラスタ内の 1 台の vSphere Bitfusion サーバ仮想マシンがオフラインの場合、別のサーバをクラスタに追加することができません。
回避策:次のタスクのいずれかを行なってください。
- vSphere Bitfusion プラグインを使用して、クラスタからサーバを削除します。
- vSphere Client を使用して、サーバ仮想マシン上のゲスト OS 環境変数
guestinfo.bitfusion.server.cassandra-removenode
を設定します。 - 実行中の vSphere Bitfusion サーバのターミナルで、
bitfusion removenode
コマンドを実行します。
-
vSphere Bitfusion サーバ仮想マシンのクローン作成後、または後続の vSphere Bitfusion サーバのインストール後に、必須フィールドがないか、不完全であることが原因で新しい仮想マシンを起動できない
vCenter Server の仮想マシンのクローン作成操作で、ウィザードの必須フィールドのいずれも必須としてマークされていません。vCenter Server 内の後続の vSphere Bitfusion サーバのインストール操作で、フィールドが適切に指定されていない可能性があります。その結果、仮想マシンを起動できない場合があります。
回避策:次のタスクのいずれかを行なってください。
- クローン作成またはインストール操作中に、すべてのフィールドが適切に指定されていることを確認します。
- クローン作成またはインストール操作の終了後、vCenter Server の vApp オプション エディタを使用して、フィールドの値を変更します。すべてのプロパティのリストについては、「vSphere Bitfusion vApp のプロパティ」を参照してください。
- vSphere Bitfusion サーバの仮想マシンに移動します。
- [構成] タブの [設定] を展開し、[vApp オプション] を選択します。
- リストからプロパティを選択し、[値の設定] ボタンをクリックします。
-
ソース仮想マシンを削除した後、クローン作成された仮想マシンを起動できない
vSphere Bitfusion 仮想マシンのクローン作成操作後、クローン作成された仮想マシンがパワーオンされる前にソース仮想マシンが削除されると、クローン作成された仮想マシンは起動できません。
回避策:クローン作成済みの仮想マシンをパワーオンします。次に、ソース仮想マシンを削除します。
既知の問題:ネットワークの問題
-
後続の vSphere Bitfusion サーバのインストール手順が失敗することがある
後続の vSphere Bitfusion サーバをデプロイすると、プライマリ vSphere Bitfusion サーバは HTTPS API を使用して後続の ESXi ホストに接続します。vSphere Bitfusion サーバの管理ネットワーク インターフェイスと ESXi ホストの vmx0 インターフェイスが 9,000 バイトの MTU サイズを使用している場合に、ネットワークが 2 つのインターフェイス間でこの MTU サイズをサポートしていない場合、HTTPS 接続が中止され、インストール手順が失敗することがあります。
回避策:
- 2 つのインターフェイス間でサポートされる最大の MTU サイズを特定します。
- vSphere Bitfusion サーバのターミナルに接続するには、
ssh customer@$server_ip
を実行します。 - 次のシェル スクリプトを実行します。
-
target_host=(ESXi host IP or DNS name) size=1272 while ping -s $size -M do -c1 $target_host >&/dev/null; do ((size+=4)); done echo "Max MTU size: $((size-4+28))
-
- vSphere Bitfusion サーバのターミナルに接続するには、
- ESXi ホストの vmx0 インターフェイスの MTU サイズの値を、2 つのインターフェイス間でサポートされる最大の MTU サイズに変更します。
- 2 つのインターフェイス間でサポートされる最大の MTU サイズを特定します。
-
クローン作成された vSphere Bitfusion サーバのネットワークアダプタを構成できない
vCenter Server での vSphere Bitfusion サーバ仮想マシンのクローン作成操作中は、追加のネットワーク アダプタの構成を変更できません。
回避策:次のタスクのいずれかを行なってください。
- 元の仮想マシンを作成するときに、クローン作成された仮想マシンに必要なネットワーク インターフェイスを有効にします。
- vCenter Server の vApp オプション エディタを使用して、ネットワーク設定の値を変更します。すべてのプロパティのリストについては、「vSphere Bitfusion vApp のプロパティ」を参照してください。
- vSphere Bitfusion サーバの仮想マシンに移動します。
- [構成] タブの [設定] を展開し、[vApp オプション] を選択します。
- リストからプロパティを選択し、[値の設定] ボタンをクリックします。
-
ネットワークに複数のネットワーク インターフェイスを接続できない
特定のネットワークにはネットワーク インターフェイスを 1 つのみ接続できます。
回避策:Bitfusion サーバを複数のネットワークに接続するには、複数のネットワーク インターフェイスを使用します。
-
インターネット プロトコル バージョン 6 にサポートしていない
今回のリリースでは IPv6 はサポートされていません。
既知の問題:その他の問題
-
vSphere Bitfusion アプライアンスのデプロイ中に、vCenter Server が vSphere Bitfusion 証明書の誤った警告を報告することがある
vSphere Bitfusion 4.0 アプライアンスを使用してプライマリ vSphere Bitfusion サーバを vCenter Server 7.0.2 にインストールすると、[OVF テンプレートのデプロイ] ダイアログ ボックスの [詳細の確認] ページに次の警告が表示されることがあります:
Invalid certificate.
警告は誤りで、vSphere Bitfusion 証明書は有効です。回避策:警告を無視し、[次へ] をクリックして OVF テンプレートの詳細を確認します。この問題は、今後の vCenter Server リリースで修正されます。
-
[健全性ログ] ダイアログ ボックスの [グローバルのデフォルトに一致] ボタンが無効になっていることがある
[設定] > [グローバル健全性チェックのデフォルト] タブですべての vSphere Bitfusion サーバのグローバル健全性チェック設定を変更して vSphere Bitfusion サーバの健全性ステータスを確認した後、[健全性ログ] ダイアログ ボックスの [グローバルのデフォルトに一致] ボタンが無効になることがあります。これは、JavaScript のエラーです。
回避策:トグル ボタンをクリックして健全性チェックの有効/無効を切り替え、[保存] をクリックします。
-
vSphere Bitfusion 3.0 クラスタのリストア操作が失敗する
マルチノードの vSphere Bitfusion クラスタをバックアップからリストアした後、データの損失が発生して vSphere Bitfusion プラグインのグローバル設定が変更されない可能性があります。
回避策:すべての vSphere Bitfusion サーバを順次再起動し、各サーバの再起動後に 60 秒間待機します。
-
vSphere Bitfusion 4.0 クラスタのリストア操作が失敗する
マルチサーバの vSphere Bitfusion 4.0 クラスタをバックアップからリストアした後、Apache Cassandra のエラーが発生することがあります。
回避策:現在のプライマリ サーバと後続の vSphere Bitfusion サーバのホスト ID を使用して、vSphere Bitfusion 4.0 アプライアンスで新しいサーバ仮想マシンをデプロイし、バックアップをリストアします。必要なすべての手順の詳細なリストについては、『vSphere Bitfusion インストール ガイド』のサーバ アップグレード手順を参照してください。
-
高速アップロード ネットワークがない場合、ローカル マシンからの OVA ファイルの選択が失敗することがある
高速アップロード ネットワークがない場合、vSphere Bitfusion プラグインを使用して後続のサーバをインストールする際に、ローカル マシンからの OVA ファイルの選択が失敗することがあります。通常、多くのブラウザには 5 分のタイムアウト制限があり、vSphere Bitfusion の OVA ファイルのサイズは約 740 MB です。
回避策:URL から OVA ファイルを選択します。
-
指定した期間に vSphere Bitfusion 監視データのダウンロードができない
vSphere Bitfusion プラグインのタブで [CSV のダウンロード] ボタンをクリックすると、指定した期間とは関係なく、ダウンロードしたファイルには 2 日間のデータが含まれます。
-
CentOS 7 および 8 にインストールされた vSphere Bitfusion 3.5 以前のクライアントでライブラリ エラーが発生する場合がある
CentOS 7 および 8 用の vSphere Bitfusion 3.5 以前のクライアントは、EPEL capstone RPM パッケージからインストールされる
libcapstone.so.3
ライブラリに依存しています。capstone パッケージには現在、libcapstone.so.4
ライブラリのみが含まれています。vSphere Bitfusion クライアントがインストールされると、クライアントは EPEL から最新のライブラリを含む最新のパッケージをダウンロードしてインストールしますが、次のエラー メッセージが表示されることがあります。error while loading shared libraries: libcapstone.so.3: cannot open shared object
回避策:次のタスクのいずれかを行なってください。
- vSphere Bitfusion サーバとクライアントをバージョン 4.0.0 以降にアップデートします。
libcapstone.so.3
ライブラリを含む古いバージョンの capstone パッケージをインストールします。
-
vSphere Bitfusion 2.5 以降のライセンスを使用すると、vCenter Server バージョン 7.0.0 以前でエラーが発生することがある
vCenter Server バージョン 7.0.0 以前では、vSphere Bitfusion は文字列を使用して vSphere Bitfusion ライセンスの有効性を判断します。文字列の結果が一致しない場合、ライセンスの問題が発生する可能性があります。
回避策:vCenter Server をバージョン 7.0.2 以降にアップグレードします。