VMware Cloud Director Container Service Extension 4.0 | 2022 年 11 月 17 日 | ビルド:20803846 このリリースノートの追加事項や更新事項を確認してください。 |
VMware Cloud Director Container Service Extension 4.0 | 2022 年 11 月 17 日 | ビルド:20803846 このリリースノートの追加事項や更新事項を確認してください。 |
VMware Cloud Director の Kubernetes Container Clusters ユーザー インターフェイス プラグインで、Kubernetes クラスタの作成、アップグレード、サイズ変更、削除などのクラスタ ライフサイクル管理タスクを実行できるようになりました。
[CSE 管理] タブ:Kubernetes Container Clusters ユーザー インターフェイス プラグインの新しいサービス プロバイダ個人設定ワークフロー。このワークフローは、サービス プロバイダがユーザー インターフェイス プラグインで設定する VMware Cloud Director Container Service Extension について案内し、テナント ユーザーが Kubernetes クラスタを作成できるように環境を準備します。
Tanzu Kubernetes Grid クラスタのマルチノード制御プレーン ユーザー インターフェイス。Kubernetes 制御プレーンの可用性を向上させることができます。
メモリまたは CPU を大量に使用するコンテナに対応できるクラスタを構築するための、カスタム サイズ ノードを備えた異種クラスタ。
作成時に Tanzu Kubernetes Grid クラスタに Tanzu コア パッケージを事前にインストールすることで、コンテナ化されたアプリケーションによる追加の構成が削減されます。
Tanzu Kubernetes Grid クラスタでの GPU サポート。これにより、AI/ML アプリケーションが使用可能になります。
VMware Cloud Director Container Service Extension ユーザー インターフェイスは、次の言語にローカライズされています。ドイツ語 (de_DE)、フランス語 (fr_FR)、イタリア語 (it_IT)、スペイン語 (es_ES)、ポルトガル語(ブラジル)(pt_BR)、日本語 (ja_JP)、韓国語 (ko_KR)、簡体字中国語 (zh_CN)、繁体字中国語 (zh_TW)。
VMware Cloud Director Container Service Extension はアプライアンスとしてパッケージ化されており、Photon OS 3.0 を使用します。
VMware Cloud Director Container Service Extension は HA 環境をサポートしており、クラスタの作成、アップグレード、サイズ変更、削除などのクラスタ管理タスクの可用性を向上させることができます。
VMware Data Solutions Extension を使用した VMware RabbitMQ の展開のサポート。詳細については、VMware Cloud Director extension for VMware Data Solutionsを参照してください。
制御プレーンに特定の LB VIP とサブネットを選択して、追加のネットワーク セキュリティを管理したり、ビジネス継続性を実現したりできます。
VMware Cloud Director のクラスタ API である CAPVCD 1.0.0 は、VMware Cloud Director Container Service Extension 4.0 とともにリリースされました。CAPVCD 1.0.0 を個別に使用して、Kubernetes クラスタのライフサイクルを管理できます。詳細については、https://github.com/vmware/cluster-api-provider-cloud-directorを参照してください。
クラスタがエラー ステータスの場合、Kubernetes Container Clusters ユーザー インターフェイス プラグインでクラスタの削除操作が失敗することがある。
エラー ステータスのクラスタを削除するには、クラスタを強制的に削除する必要があります。
VMware Cloud Director にログインし、ナビゲーション バーから [詳細] > [Kubernetes Container Clusters] の順に選択します。
クラスタを選択し、クラスタ情報画面で [削除] をクリックします。
[クラスタの削除] 画面で、[強制削除] チェックボックスをオンにしてから、[削除] をクリックします。
VMware Cloud Director Container Service Extension で、スクリプト実行エラーが原因で Tanzu Kubernetes Grid クラスタの作成に失敗することがある。
Kubernetes コンテナ クラスタ ユーザー インターフェイスのクラスタ情報画面の イベント タブに、次のエラーが表示されます。
ScriptExecutionTimeout
次の詳細も表示されます。
error while bootstrapping the machine [cluster-name/EPHEMERAL_TEMP_VM]; timeout for post customization phase [phase name of script execution]
回避策:
このエラーが発生した場合は、クラスタの設定から [エラー時の自動修復] を有効にすることをお勧めします。これにより、VMware Cloud Director Container Service Extension はクラスタの作成を再試行します。
VMware Cloud Director にログインし、ナビゲーション バーから [詳細] > [Kubernetes Container Clusters] の順に選択します。
クラスタを選択し、クラスタ情報画面で [設定] をクリックし、[エラー時の自動修復] トグルを有効にします。
保存 をクリックします。
クラスタ作成の問題をトラブルシューティングするときには、[エラー時の自動修復] を無効にすることをお勧めします。
マルチ制御プレーンまたはマルチワーカー ノードのクラスタ作成でエラー状態が発生する。クラスタの詳細画面の [イベント] タブに、VMware Cloud Director で短期仮想マシンの削除に失敗したことによる EphemeralVMError
イベントが表示されます。
クラスタで [エラー時の自動修復] 設定が有効になっている場合は、同じエラー イベントが繰り返し表示されることがあります。[エラー時の自動修復] 設定が無効の場合は、制御プレーン ノードとワーカー ノードが正常に作成されても、VMware Cloud Director 内で短期仮想マシンを削除できないことが原因でクラスタがエラー状態を示すことがあります。
この問題は、VMware Cloud Director 10.3.3.3 よりも後のすべてのリリースとパッチ リリース、および VMware Cloud Director 10.4.1 以降のすべてのリリースとパッチ リリースで発生します。
回避策:
1 つの制御プレーンと 1 つのワーカー ノードを持つクラスタを作成し、目的のノード数に合わせてクラスタのサイズを変更します。
この問題は、VMware Cloud Director Container Service Extension 4.0.3 リリースで修正されています。
ノードがクラスタに参加できないことがある。これは、断続的に発生する問題であるため、不規則なタイミングで発生します。クラスタが使用可能な状態でも関係ありません。
Kubernetes コンテナ クラスタ ユーザー インターフェイスのクラスタ情報画面の イベント タブに、次のエラーが表示されます。
VcdMachineScriptExecutionError
次の詳細も表示されます。
script failed with status [x] and reason [Date Time 1 /root/node.sh: exit
[x]]
回避策:
参加に失敗したノードを含むクラスタに対して、この回避策を実行します。この回避策では、今後のクラスタ作成の問題は解決されません。
この問題が発生した場合は、この手動による回避策を実行する必要があります。参加に失敗するノードの数は、1 つの場合も複数の場合もあります。参加していないノードそれぞれに対して、以下の手順 2 以降の手順を実行する必要があります。
参加していないノードがあるクラスタの kube 構成をダウンロードします。
VMware Cloud Director にログインし、ナビゲーション バーから [詳細] > [Kubernetes Container Clusters] の順に選択します。
クラスタを選択し、クラスタ情報画面で [kube 構成のダウンロード] をクリックします。
kube 構成ファイルの詳細については、Kubernetes の Web サイトを参照してください。
Kubernetes Container Clusters ユーザー インターフェイス プラグインで、クラスタ情報画面の [イベント] タブの [VcdMachineScriptExecutionError
] をクリックしてエラーの詳細を表示し、[リソース名] をメモします。
kubectl で、次のコマンドを入力して、クラスタ上のすべてのマシンを取得します。
kubectl get machines -A --kubeconfig=<path of downloaded kubeconfig>
クラスタに参加できなかったノードは、[プロビジョニング] 状態で停止しているはずです。そのノードを特定するには、VcdMachineScriptExecutionError
に含まれていたリソース名を持つマシン名を探します。
kubectl で、次のコマンドを入力します。
Run `kubectl --kubeconfig=<path of downloaded kubeconfig> delete machine -n clusterNamespace machineName
削除するマシンの名前が、VcdMachineScriptExecutionError
に含まれていたリソース名と一致していることを確認します。
仮想マシンは削除されると、再作成され、ノードがクラスタへの参加を再試行します。
ERROR: failed to create cluster: failed to pull image
障害
このエラーは、次の状況で発生します。
ユーザーが VMware Cloud Director Container Service Extension 4.0 を使用して Tanzu Kubernetes Grid クラスタを作成すると、断続的に失敗します。
HTTP 408 応答が原因で発生するイメージ プル エラーが報告されます。
この問題は、EPHEMERAL_TEMP_VM からインターネットにアクセスして必要なイメージをプルできない場合に発生する可能性があります。
可能性のある原因:
低速または断続的なインターネット接続。
ネットワーク IP アドレス プールで DNS を解決できません(Docker プル エラー)。
ファイアウォールの背後のネットワーク MTU の設定値を小さくする必要があります。
この問題を解決するには、EPHEMERAL_TEMP_VM からのインターネット アクセスの妨げとなるネットワーク接続問題が発生していないことを確認します。
組織にレガシー権限バンドルが存在する場合、Kubernetes Container Clusters ユーザー インターフェイス プラグインでクラスタ操作を実行すると、認証エラーが発生する可能性がある。
VMware Cloud Director をバージョン 9.1 以前からアップグレードすると、組織ごとにレガシー権限バンドルがシステムに配置されます。このレガシー権限バンドルにはアップグレード時点で関連付けられた組織で使用可能な権限で、この組織でのみ公開されているものが含まれています。既存の組織の権限バンドル モデルを使用するには、対応するレガシー権限バンドルを削除する必要があります。詳細については、権限およびロールの管理を参照してください。
レガシー権限バンドルは、サービス プロバイダ ポータルの [管理] タブで削除できます。詳細については、権限バンドルの削除を参照してください。Kubernetes Container Clusters ユーザー インターフェイス プラグイン CSE 管理には、Kubernetes クラスタ権限バンドルを自動的に作成し、すべてのテナントに公開するサーバ セットアップ プロセスがあります。権限バンドルには VMware Cloud Director Container Service Extension 4.0 の Kubernetes クラスタ管理に関連するすべての権限が含まれています。
kubectl を使用した Tanzu Kubernetes Grid クラスタのサイズ変更またはアップグレード。
Kubernetes Container Clusters ユーザー インターフェイス プラグインでクラスタを作成した後、kubectl を使用して、Tanzu Kubernetes Grid クラスタのワークロードを管理できます。
Kubernetes Container Clusters ユーザー インターフェイス プラグインの代わりに kubectl を使用してクラスタのライフサイクル管理、サイズ変更、アップグレードも行う場合は、次の手順を実行します。
次のコマンドでクラスタから RDE-Projector オペレータを削除します: kubectl delete deployment -n rdeprojector-system rdeprojector-controller-manager
Kubernetes Container Clusters ユーザー インターフェイス プラグインから Tanzu Kubernetes Grid クラスタを分離します。
VMware Cloud Director ユーザー インターフェイスの クラスタの概要 画面で、クラスタのクラスタ ID を取得します。
entity.spec.vcdKe.isVCDKECluster
で RDE を false に更新します。
クラスタのペイロードを取得します - GET https://<vcd>/cloudapi/1.0.0/entities/<Cluster ID>
ペイロードの json パスをコピーして更新します。- entity.spec.vcdKe.isVCDKECluster
を false に設定します。
PUT https://<vcd>/cloudapi/1.0.0/entities/<Cluster ID>
を変更されたペイロードに実行します。ペイロードの全体を PUT 操作の本文として含める必要があります。
この時点で、クラスタは VMware Cloud Director Container Service Extension 4.0.0 および 4.0.1 から分離され、VMware Cloud Director Container Service Extension 4.0.0 および 4.0.1 を使用してクラスタを管理することはできなくなります。クラスタ API 仕様の CAPI yaml を直接適用することで、kubectl を使用してクラスタの管理、サイズ変更、アップグレードを実行できるようになります。
無効な GitHub トークンが原因で VMware Cloud Director Container Service Extension でのクラスタの作成が次のエラーを表示して失敗する:401 認証情報が不正です
これは、クラスタ作成中の予期されるエラーです。ユーザーが無効な Github アクセス トークンを設定した場合、クラスタの作成は失敗し、次のエラーが表示されます。
error creating the GitHub repository client: failed to get GitHub latest version: failed to get repository
versions: failed to get repository versions: failed to get the list of releases: GET
https://api.github.com/repos/kubernetes-sigs/cluster-api/releases: 401 Bad credentials
VMware Cloud Director Container Service Extension サーバを構成するときに、正確な Github アクセス トークンを入力します。
ポリシー変更のための選択後、VMware Cloud Director Container Service Extension 4 プラグインがリスト全体へのポピュレートを実行しない
ユーザーが Kubernetes Container Clusters プラグインでサイジング ポリシーを選択して変更する場合、ドロップダウン メニューには選択したサイジング ポリシーのみが表示され、代替のサイジング ポリシーは自動的にロードされません。
ユーザーが別のサイジング ポリシーを表示するには、テキストを手動で削除する必要があります。この問題は、ユーザーが配置ポリシーとストレージ ポリシーを選択した場合も、ドロップダウン メニューで発生します。
これは意図的なものです。コンボボックスの HTML、Clarity、Web コンポーネントも、同じように動作します。
注:Clarity は、VMware Cloud Director ユーザー インターフェイスの構築のベースとなる Web フレームワークです。
ドロップダウン ボックスでは、入力テキストがフィルタとして使用されます。入力フィールドに何も表示されていない状態では、すべての選択肢が表示され、入力すると選択肢が絞り込まれます。
VMware Cloud Director Container Service Extension クラスタを作成すると、大文字と小文字の区別に関するエラーが表示される
Kubernetes Container Clusters ユーザー インターフェイスで大文字を使用すると、次のエラーが表示されます。
名前は文字で開始し、英数字で終了する必要があり、英数字またはハイフン (-) のみを含めることができます。(最大 63 文字)
これは、Kubernetes によって設定された制限です。オブジェクト名は RFC 1035 ラベルで検証されます。詳細については、Kubernetes の Web サイトを参照してください。
Kubernetes Container Clusters ユーザー インターフェイス プラグイン 4.0 が、他の Kubernetes Container Clusters ユーザー インターフェイス プラグイン(3.5.0 など)と相互運用しない。
これらの 2 つのプラグインを競合せずに同時に操作する機能は、VMware Cloud Director ユーザー インターフェイスの既知の制限です。一度に有効にできるプラグインは 1 つのみです。
vSphere またはその他の基盤となるインフラストラクチャでの障害が原因でクラスタのノードが削除された場合、VMware Cloud Director Container Service Extension がユーザーに通知せず、クラスタを自動修復しない。
クラスタのノードが削除された場合、クラスタのサイズ変更やクラスタのアップグレードなどの基本的なクラスタ操作は引き続き機能します。削除されたノードは削除状態のままになり、クラスタのサイズに関する計算に含まれます。
クラスタの Kubeconfig をダウンロードします。
次のコマンドを使用して、削除されたノード構成が引き続き使用されるマシンを削除します。
kubectl --kubeconfig=<path to downloaded kubeconfig> get machines -A # try to match the machine name
here; also get namespace
kubectl -n <namespace name from above> --kubeconfig=<path to downloaded kubeconfig> delete machine
<machine name>
# wait for machine to get deleted
上記のコマンドを実行するとマシンが削除され、CAPVCD によって新しいマシンが自動的に作成されます。
VMware Cloud Director Container Service Extension で、変更できない配置ポリシーが設定されている TKG テンプレートを使用してクラスタを展開すると失敗する。
VMware Cloud Director テナント ポータルに管理者としてログインします。
[ライブラリ] > [vApp テンプレート] の順にクリックします。
[vApp テンプレート] ウィンドウで、テンプレートの左側にあるラジオ ボタンを選択します。
上部のリボンで [コンピューティング ポリシーを使用したタグ付け] をクリックします。
[変更可能] チェックボックスをオンにして、[タグ] をクリックします。
VMware Cloud Director 10.4 では、サービス プロバイダはデフォルトで VMware Cloud Director Container Service Extension 仮想マシンにログインできない。
VMware Cloud Director 10.4 では、VMware Cloud Director Container Service Extension 仮想マシンを OVA ファイルから展開した後、[仮想マシン設定] 画面の次の 2 つのチェックボックスはデフォルトでオフになります。
ローカル管理者パスワードを許可
パスワードを自動生成
プロバイダが後で VMware Cloud Director Container Service Extension 仮想マシンにログインして、トラブルシューティング タスクを実行できるようにするには、これらのチェックボックスをオンにする必要があります。
VMware Cloud Director ユーザー インターフェイスにサービス プロバイダとしてログインし、VMware Cloud Director Container Service Extension OVA ファイルから vApp を作成します。詳細については、VMware Cloud Director Container Service Extension サーバ OVA ファイルからの vApp の作成を参照してください。
vApp を展開してからパワーオンするまでの間に、[仮想マシンの詳細] > [ゲスト OS のカスタマイズ] > [ローカル管理者パスワードを許可] および [パスワードを自動生成] の順に移動します。
vApp の更新タスクが完了したら、vApp をパワーオンします。
ディスクのサイズを変更するには、組織 VDC で高速プロビジョニングを無効にする必要がある。
プロバイダとして VMware Cloud Director ユーザー インターフェイスにログインし、[リソース] を選択します。
[クラウド リソース] タブで、[組織 VDC] を選択し、組織 VDC を選択します。
[組織 VDC] ウィンドウの [ポリシー] で [ストレージ] を選択します。
[編集] をクリックし、[高速プロビジョニング] 切り替えをオフにします。
保存 をクリックします。
サービス プロバイダとしてログインしているときに、最新のユーザー インターフェイス プラグインをアップロードすると、CSE 管理 タブが表示されなくなる。
VMware Cloud Director に組み込まれている以前のユーザー インターフェイス プラグインを無効にします。
プロバイダとして VMware Cloud Director ユーザー インターフェイスにログインし、[詳細] > [Customize Portal] の順に選択します。
対象のプラグインの名前の横にあるチェック ボックスを選択し、有効化 または 無効化 をクリックします。
新しく有効にしたプラグインの使用を開始するには、インターネット ブラウザ ページを更新します。
名前または ID が同じでバージョンが異なる、有効なプラグインが複数ある場合は、最も低いバージョンのプラグインが使用されます。したがって、最も新しいバージョンのプラグインのみを有効にして、他のすべてのバージョンのプラグインを無効にします。
プラグインの管理の詳細については、プラグインの管理を参照してください。