请参阅本主题,以提取各种日志以对 主管 上的 TKG 2 集群进行故障排除,包括 主管 支持包、工作负载管理日志以及 CAPI、CAPV、虚拟机运算符和 TKG 控制器管理器日志。
收集 主管 的支持包
要对 TKG 2 集群错误进行故障排除,可以导出
主管 日志。通常情况下,应在 VMware 技术支持团队的帮助下查看这些日志。
- 使用 vSphere Client 登录到 vSphere with Tanzu 环境。
- 选择 。
- 选择主管选项卡。
- 选择目标主管实例。
- 选择导出日志。
收集支持包后,请参阅以下知识库文章:《通过 Secure FTP 门户上载 VMware 的诊断信息》(网址:http://kb.vmware.com/kb/2069559)。
跟踪工作负载管理日志文件
跟踪工作负载控制平面 (WCP) 日志文件可帮助您对
主管 和 TKG 集群错误进行故障排除。
- 建立与 vCenter Server Appliance 的 SSH 连接。
- 以
root
用户身份登录。 - 运行命令
shell
。将显示以下输出:Shell access is granted to root root@localhost [ ~ ]#
- 运行以下命令以跟踪 WCP 日志文件。
tail -f /var/log/vmware/wcp/wcpsvc.log
收集特定于 TKG 的日志
主管 将运行为 TKG 2 提供基础架构的多个 Kubernetes Pod。
kubectl -n vmware-system-capw get deployments.apps NAME READY UP-TO-DATE AVAILABLE AGE capi-controller-manager 2/2 2 2 18h capi-kubeadm-bootstrap-controller-manager 2/2 2 2 18h capi-kubeadm-control-plane-controller-manager 2/2 2 2 18h capv-controller-manager 2/2 2 2 10h capw-controller-manager 2/2 2 2 18h capw-webhook 2/2 2 2 18h
基础架构 Pod 是运行副本的部署。您可能需要确定哪个副本是主副本,并查看其日志以获取最新信息。非主节点通常会在记录有关尝试获取租约的内容后停止。
您需要登录到 主管 并使用 主管 vSphere 命名空间 检查这些 Pod。
使用标签选择器的日志不能正常使用,因此您可能需要清除添加到 Pod 名称末尾的随机字符串。将输出传输到 grep“error”或 grep -i“error”有时是个很有用的开端。例如
kubectl logs <args> | grep error
。
- CAPI 日志
-
集群 API 提供程序:
kubectl logs -n vmware-system-capw -c manager vmware-system-capw-capi-controller-manager-<id>
- CAPV 日志
-
vSphere 提供程序的集群 API:
kubectl logs -n vmware-system-capv -c manager vmware-system-capw-v1alpha3-vmware-system-capv-v1alpha3-controller-manager-<id>
- VM Operator 日志
-
虚拟机操作员:
kubectl logs -n vmware-system-vmop -c manager vmware-system-vmop-controller-manager-<id>
- TKG 控制器管理器日志
-
GCM 控制器管理器
kubectl logs -n vmware-system-tkg -c manager vmware-system-tkg-controller-manager-<id>