請參閱本主題,以提取各種記錄以對 主管 上的 TKG 叢集進行疑難排解,包括 主管 支援服務包、工作負載管理記錄以及 CAPI、CAPV、虛擬機器運算子和 TKG 控制器管理程式記錄。
收集 主管 叢集的支援服務包
若要對 TKG 叢集錯誤進行疑難排解,可以匯出
主管 記錄。通常,應在 VMware 支援的協助下檢閱這些記錄。
- 使用 vSphere Client 登入 vSphere IaaS control plane 環境。
- 選取 。
- 選取主管索引標籤。
- 選取目標主管執行個體。
- 選取匯出記錄。
收集支援服務包後,請參閱下列知識庫文章:〈透過 Secure FTP 入口網站上傳 VMware 的診斷資訊〉(網址:http://kb.vmware.com/kb/2069559)。另請參閱收集 vSpehre with Tanzu 的記錄。
收集 TKG 叢集的支援服務包
您可以使用 TKC Support Bundler 公用程式來收集 TKG 叢集記錄檔,並對問題進行疑難排解。
若要取得並使用 TKC 支援服務包公用程式,請參閱 VMware 支援知識庫文章收集 vSpehre with Tanzu 的記錄。
跟蹤工作負載管理記錄檔
跟蹤工作負載控制平面 (WCP) 記錄檔可協助您對
主管 和 TKG 叢集錯誤進行疑難排解。
- 建立與 vCenter Server Appliance 的 SSH 連線。
- 以
root
身分登入。 - 執行
shell
命令。您會看到下列內容:Shell access is granted to root root@localhost [ ~ ]#
- 執行以下命令以跟蹤 WCP 記錄檔。
tail -f /var/log/vmware/wcp/wcpsvc.log
從 主管 收集特定於 TKG 的記錄
主管 將執行為 TKG 2.0 提供基礎結構的多個 Kubernetes 網繭。
kubectl -n vmware-system-capw get deployments.apps NAME READY UP-TO-DATE AVAILABLE AGE capi-controller-manager 2/2 2 2 18h capi-kubeadm-bootstrap-controller-manager 2/2 2 2 18h capi-kubeadm-control-plane-controller-manager 2/2 2 2 18h capv-controller-manager 2/2 2 2 10h capw-controller-manager 2/2 2 2 18h capw-webhook 2/2 2 2 18h
基礎結構網繭是執行複本的部署。您需要確定哪個複本是主網繭,並查看其記錄以取得最新資訊。非主網繭通常會在記錄有關嘗試擷取租用的資訊後停止。
您需要登入 主管 並使用 主管 vSphere 命名空間 檢查這些網繭。
使用標籤選取器的記錄不能正常使用,因此您可能需要清除新增到網繭名稱末尾的隨機字串。將輸出傳輸到 grep 'error’ 或 grep -i 'error’ 有時是個很有用的開端。例如
kubectl logs <args> | grep error
。
- CAPI 記錄
-
叢集 API 提供者。
kubectl logs -n vmware-system-capw -c manager vmware-system-capw-capi-controller-manager-<id>
- CAPV 記錄
-
vSphere 提供者的叢集 API:
kubectl logs -n vmware-system-capv -c manager vmware-system-capw-v1alpha3-vmware-system-capv-v1alpha3-controller-manager-<id>
- 虛擬機器運算子記錄
-
虛擬機器運算子。
kubectl logs -n vmware-system-vmop -c manager vmware-system-vmop-controller-manager-<id>
- TKG 控制器管理程式記錄
-
GCM 控制器管理程式
kubectl logs -n vmware-system-tkg -c manager vmware-system-tkg-controller-manager-<id>