请参阅本主题,提取各种日志以对 主管 上的 TKG 集群进行故障排除,包括 主管 支持包、工作负载管理日志以及 CAPI、CAPV、VM Operator 和 TKG 控制器管理器日志。

收集 主管 的支持包

要对 TKG 集群错误进行故障排除,可以导出 主管 日志。通常情况下,应在 VMware 技术支持团队的帮助下查看这些日志。
  1. 使用 vSphere Client 登录到 vSphere IaaS control plane 环境。
  2. 选择菜单 > 工作负载管理
  3. 选择主管选项卡。
  4. 选择目标主管实例。
  5. 选择导出日志

收集支持包后,请参阅以下知识库文章:《通过 Secure FTP 门户上载 VMware 的诊断信息》(网址:http://kb.vmware.com/kb/2069559)。另请参见收集 vSpehre with Tanzu 日志

收集 TKG 集群的支持包

您可以使用 TKC Support Bundler 实用程序来收集 TKG 集群日志文件,并对问题进行故障排除。

要获取并使用 TKC Support Bundler 实用程序,请参阅 VMware 技术支持知识库文章收集 vSpehre with Tanzu 日志

跟踪工作负载管理日志文件

跟踪工作负载控制平面 (WCP) 日志文件可帮助您对 主管 和 TKG 集群错误进行故障排除。
  1. 建立与 vCenter Server Appliance 的 SSH 连接。
  2. root 用户身份登录。
  3. 运行命令 shell
    将显示以下输出:
    Shell access is granted to root
    root@localhost [ ~ ]#
    
  4. 运行以下命令以跟踪 WCP 日志文件。
    tail -f /var/log/vmware/wcp/wcpsvc.log

主管 收集特定于 TKG 的日志

主管 将运行为 TKG 2.0 提供基础架构的多个 Kubernetes Pod。
kubectl -n vmware-system-capw get deployments.apps
NAME                                            READY   UP-TO-DATE   AVAILABLE   AGE
capi-controller-manager                         2/2     2            2           18h
capi-kubeadm-bootstrap-controller-manager       2/2     2            2           18h
capi-kubeadm-control-plane-controller-manager   2/2     2            2           18h
capv-controller-manager                         2/2     2            2           10h
capw-controller-manager                         2/2     2            2           18h
capw-webhook                                    2/2     2            2           18h

基础架构 Pod 是运行副本的部署。您可能需要确定哪个副本是主副本,并查看其日志以获取最新信息。非主节点通常会在记录有关尝试获取租约的内容后停止。

您需要登录到 主管 并使用 主管 vSphere 命名空间 检查这些 Pod。

使用标签选择器的日志不能正常使用,因此您可能需要清除添加到 Pod 名称末尾的随机字符串。将输出传输到 grep“error”或 grep -i“error”有时是个很有用的开端。例如 kubectl logs <args> | grep error
CAPI 日志
集群 API 提供程序:
kubectl logs -n vmware-system-capw -c manager vmware-system-capw-capi-controller-manager-<id>
CAPV 日志
vSphere 提供程序的集群 API:
kubectl logs -n vmware-system-capv -c manager vmware-system-capw-v1alpha3-vmware-system-capv-v1alpha3-controller-manager-<id>
VM Operator 日志
虚拟机操作员:
kubectl logs -n vmware-system-vmop -c manager vmware-system-vmop-controller-manager-<id>
TKG 控制器管理器日志
GCM 控制器管理器
kubectl logs -n vmware-system-tkg -c manager vmware-system-tkg-controller-manager-<id>