当 TKG 控制器置备 TKG 集群时,系统会报告几个状态条件,您可以通过这些条件直观地了解计算机运行状况的关键方面。
检查 TKG 集群就绪状态
可通过 TKG 集群就绪状态确定哪个阶段或组件尚未就绪(如果有)。
检查集群就绪状态后,为进一步诊断,可以通过 vSphereCluster 和计算机状况进一步详细了解故障细节。
要检查 TKG 集群的就绪状态,请执行以下操作:
- 登录到 主管。
- 将上下文切换到置备了目标集群的 vSphere 命名空间。例如:
kubectl config use-context tkg-cluster-ns
- 根据 TKG 集群的类型运行命令
kubectl get tkc -o yaml
或kubectl get cluster -o yaml
。该命令将返回集群组件的就绪状态。有关各种就绪状态的说明,请参阅后面的部分。
ControlPlaneReady 状况和原因
下表列出并描述了
ControlPlaneReady
状况。
状况类型 | 描述 |
---|---|
ControlPlaneReady |
报告控制平面节点对于集群是否就绪并且是否正常运行。 |
下表列出并描述了 ControlPlaneReady
状况可能为 false 的原因。
原因 | 描述 |
---|---|
WaitingForClusterInfrastructure |
表示集群正在等待运行计算机所需的必备条件(如负载均衡器)。仅当 InfrastructureCluster 不报告其自己的就绪状况时,才会使用此原因。 |
WaitingForControlPlaneInitialized |
表示第一个控制平面节点正在初始化。 |
WaitingForControlPlane |
反映KubeadmControlPlane的状况。如果 KubeadmControlPlane 不报告其自己的就绪状况,则会使用此原因。 |
正在等待集群基础架构准备就绪 | 此消息表示集群正在等待运行计算机所需的必备条件(如网络连接和负载均衡器)。 |
NodesHealthy 状况和原因
下表列出并描述了
NodesHealthy
状况。
状况类型 | 描述 |
---|---|
NodesHealthy |
报告TanzuKubernetesCluster节点的状态。 |
下表列出并描述了 NodesHealthy
状况不为 true 的原因。
原因 | 描述 |
---|---|
WaitingForNodesHealthy |
记录并非所有节点都处于正常状态。 |
插件条件和原因
下表列出并描述了与集群加载项相关的状况。
状况类型 | 描述 |
---|---|
AddonsReady |
TanzuKubernetesCluster 加载项(CoreDNS、KubeProxy、CSP、CPI、CNI、AuthSvc)的状况摘要。 |
CNIProvisioned |
记录 TanzuKubernetesCluster 容器网络接口 (CNI) 加载项的状态。 |
CSIProvisioned |
记录 TanzuKubernetesCluster 容器存储接口 (CSI) 加载项的状态。 |
CPIProvisioned |
记录 TanzuKubernetesCluster 云提供商接口 (CPI) 加载项的状态。 |
KubeProxyProvisioned |
记录TanzuKubernetesCluster KubeProxy插件的状态。 |
CoreDNSProvisioned |
记录 TanzuKubernetesCluster CoreDNS 加载项的状态。 |
AuthServiceProvisioned |
记录TanzuKubernetesCluster AuthService插件的状态。 |
PSPProvisioned |
记录PodSecurityPolicy的状态。 |
下表列出并描述了加载项状况不为 true 的原因。要对导致警告的症状进行故障排除,请参阅
对 TKG Service 集群进行故障排除。
原因 | 严重性 | 描述 |
---|---|---|
AddonsReconciliationFailed |
不适用 | 所有加载项协调失败的概要原因。 |
CNIProvisioningFailed |
警告 | 记录 CNI 加载项无法创建或更新。 |
CSIProvisioningFailed |
警告 | 记录 CSI 加载项无法创建或更新。 |
CPIProvisioningFailed |
警告 | 记录 CPI 加载项无法创建或更新。 |
KubeProxyProvisioningFailed |
警告 | 记录 KubeProxy 加载项无法创建或更新。 |
CoreDNSProvisioningFailed |
警告 | 记录 CoreDNS 加载项无法创建或更新。 |
AuthServiceProvisioningFailed |
警告 | 文档AuthService插件无法创建或更新。 |
AuthServiceUnManaged |
记录 AuthService 不受控制器管理。 | |
PSPProvisioningFailed |
警告 | 文档PodSecurityPolicy插件无法创建或更新。 |
其他条件和原因
下表列出并介绍了 StorageClass 和 RoleBinding 同步、ProviderServiceAccount 资源协调、ServiceDiscovery 和 TKG 2.0 集群兼容性的条件。
条件 | 描述 |
---|---|
StorageClassSynced |
记录 StorageClass 同步从主管集群到工作负载集群的状态。 |
RoleBindingSynced |
记录 RoleBinding 同步从主管集群到工作负载集群的状态。 |
ProviderServiceAccountsReady |
记录创建提供商服务帐户以及相关角色、RoleBindings 和密钥的状态。 |
ServiceDiscoveryReady |
记录服务发现的状态。 |
TanzuKubernetesReleaseCompatible |
指示TanzuKubernetesCluster是否与TanzuKubernetesRelease兼容。 |
下表列出并描述了其他状况不为 true 的原因。
原因 | 描述 |
---|---|
StorageClassSyncFailed |
报告StorageClass同步失败。 |
RoleBindingSyncFailed |
报告RoleBinding同步失败。 |
ProviderServiceAccountsReconciliationFailed |
报告提供商服务帐户相关资源协调失败。 |
SupervisorHeadlessServiceSetupFailed |
记录主管集群 API 服务器的无外设服务设置失败。 |