请参阅本主题,以提取各种日志以对 主管 上的 TKG 2 集群进行故障排除,包括 主管 支持包、工作负载管理日志以及 CAPI、CAPV、虚拟机运算符和 TKG 控制器管理器日志。

收集 主管 的支持包

要对 TKG 2 集群错误进行故障排除,可以导出 主管 日志。通常情况下,应在 VMware 技术支持团队的帮助下查看这些日志。
  1. 使用 vSphere Client 登录到 vSphere with Tanzu 环境。
  2. 选择菜单 > 工作负载管理
  3. 选择主管选项卡。
  4. 选择目标主管实例。
  5. 选择导出日志

收集支持包后,请参阅以下知识库文章:《通过 Secure FTP 门户上载 VMware 的诊断信息》(网址:http://kb.vmware.com/kb/2069559)。

跟踪工作负载管理日志文件

跟踪工作负载控制平面 (WCP) 日志文件可帮助您对 主管 和 TKG 集群错误进行故障排除。
  1. 建立与 vCenter Server Appliance 的 SSH 连接。
  2. root 用户身份登录。
  3. 运行命令 shell
    将显示以下输出:
    Shell access is granted to root
    root@localhost [ ~ ]#
    
  4. 运行以下命令以跟踪 WCP 日志文件。
    tail -f /var/log/vmware/wcp/wcpsvc.log

收集特定于 TKG 的日志

主管 将运行为 TKG 2 提供基础架构的多个 Kubernetes Pod。
kubectl -n vmware-system-capw get deployments.apps
NAME                                            READY   UP-TO-DATE   AVAILABLE   AGE
capi-controller-manager                         2/2     2            2           18h
capi-kubeadm-bootstrap-controller-manager       2/2     2            2           18h
capi-kubeadm-control-plane-controller-manager   2/2     2            2           18h
capv-controller-manager                         2/2     2            2           10h
capw-controller-manager                         2/2     2            2           18h
capw-webhook                                    2/2     2            2           18h

基础架构 Pod 是运行副本的部署。您可能需要确定哪个副本是主副本,并查看其日志以获取最新信息。非主节点通常会在记录有关尝试获取租约的内容后停止。

您需要登录到 主管 并使用 主管 vSphere 命名空间 检查这些 Pod。

使用标签选择器的日志不能正常使用,因此您可能需要清除添加到 Pod 名称末尾的随机字符串。将输出传输到 grep“error”或 grep -i“error”有时是个很有用的开端。例如 kubectl logs <args> | grep error
CAPI 日志
集群 API 提供程序:
kubectl logs -n vmware-system-capw -c manager vmware-system-capw-capi-controller-manager-<id>
CAPV 日志
vSphere 提供程序的集群 API:
kubectl logs -n vmware-system-capv -c manager vmware-system-capw-v1alpha3-vmware-system-capv-v1alpha3-controller-manager-<id>
VM Operator 日志
虚拟机操作员:
kubectl logs -n vmware-system-vmop -c manager vmware-system-vmop-controller-manager-<id>
TKG 控制器管理器日志
GCM 控制器管理器
kubectl logs -n vmware-system-tkg -c manager vmware-system-tkg-controller-manager-<id>