In questa sezione viene descritto come configurare, attivare e disattivare i parametri del Controllo di integrità del nodo nei cluster di Tanzu Kubernetes Grid tramite il plug-in dell'interfaccia utente di Kubernetes Container Clusters 4.1.

La funzionalità Controllo di integrità del nodo include due parti: Rilevazione e Correzione.
Nota: Controllo di integrità del nodo e Riparazione automatica in caso di errori hanno funzionalità differenti. Controllo di integrità del nodo rileva e corregge i nodi non integri nel cluster solo dopo che il cluster passa allo stato Disponibile, mentre Correzione automatica errori tenta nuovamente di creare il cluster se il questo passa allo stato di errore prima che il suo stato diventi Disponibile.
Nota: Controllo di integrità del nodo è disattivato per impostazione predefinita in VMware Cloud Director Container Service Extension 4.1.

Rilevazione errori del nodo

VMware Cloud Director Container Service Extension 4.1 è in grado di rilevare quando un nodo in un cluster di Tanzu Kubernetes Grid diventa non integro. Quando un nodo non è integro, il plug-in dell'interfaccia utente di Kubernetes Container Clusters 4.1 riflette il numero di nodi disponibili e desiderati nella pagina delle informazioni del cluster e l'errore viene visualizzato nella sezione Eventi della stessa pagina.

Un nodo può diventare non integro per i seguenti motivi, ma non solo
  • Interruzioni della rete
  • Interruzioni di alimentazione
  • Bassa velocità del nodo a causa dell'elevato utilizzo della memoria, della CPU o del disco
  • Errore di avvio del nodo
  • Impossibilità di unire il cluster

Correzione del nodo

A partire da VMware Cloud Director Container Service Extension 4.1, la funzionalità Controllo di integrità del nodo rileva l'errore dei nodi nei cluster in Tanzu Kubernetes Grid e sostituisce automaticamente i nodi non integri di Kubernetes con nuovi nodi. I parametri di Controllo di integrità del nodo sono impostazioni globali necessarie per la configurazione del server di VMware Cloud Director Container Service Extension e i workflow di aggiornamento del server, che vengono utilizzati dal plug-in dell'interfaccia utente di Kubernetes Container Clusters per creare cluster o aggiornare le impostazioni per i cluster in tutte le organizzazioni. Per ulteriori informazioni, vedere Aggiornamento del server di VMware Cloud Director Container Service Extension. I provider di servizi possono tornare alla scheda Aggiorna server in qualsiasi momento per riconfigurare i parametri di Controllo di integrità del nodo. Se i provider di servizi non configurano in modo specifico i parametri di Controllo di integrità del nodo vengono impostati i valori predefiniti seguenti:
Tabella 1. Configurazione del controllo di integrità del nodo
Parametro del controllo di integrità del nodo Valore predefinito Descrizione
Numero massimo di nodi non integri 100%

La correzione viene sospesa quando la percentuale di nodi non integri supera questo valore. Quando il valore predefinito è 100%, significa che il cluster viene sempre corretto. Quando il valore predefinito è 0%. significa che il cluster non esegue la correzione.

Timeout avvio nodo 900 secondi

Se un nodo non si avvia in questo intervallo di tempo, viene considerato non integro e viene corretto. Per un determinato ambiente VMware Cloud Director è consigliabile che i provider di servizi impostino il parametro Controllo di integrità del nodo affinché corrisponda almeno al doppio del tempo necessario affinché una macchina virtuale venga creata e venga effettuato il bootstrap.

Timeout stato nodo "Non pronto" 300 secondi Se un nodo appena unito non può ospitare carichi di lavoro per un periodo di tempo superiore a questo timeout, viene considerato non integro e viene corretto.
Timeout stato nodo "Sconosciuto" 300 secondi Se un nodo integro non è raggiungibile per un periodo di tempo superiore a questo timeout, viene considerato non integro e viene corretto.
Quando creano cluster, gli utenti tenant utilizzano i parametri Controllo di integrità del nodo impostati dal provider di servizi per la propria organizzazione. Per ulteriori informazioni, vedere Creazione di un cluster di Tanzu Kubernetes Grid.
Nota: Quando i provider di servizi aggiornano i parametri di Controllo di integrità del nodo, i parametri di Controllo di integrità del nodo esistenti nei cluster Tanzu Kubernetes Grid già distribuiti non vengono modificati.

Attivazione o disattivazione del controllo dello stato del nodo in un cluster VMware Cloud Director Container Service Extension 4.0.x

Gli utenti tenant possono inoltre attivare o disattivare Controllo di integrità del nodo nei cluster creati in VMware Cloud Director Container Service Extension 4.0.x.

I passaggi seguenti illustrano come gli utenti tenant possono eseguire questa azione:

  1. Accedere al portale VMware Cloud Director e dalla barra di navigazione superiore selezionare Altro > Kubernetes Container Clusters.
  2. Fare clic sul nome del cluster e nella pagina delle informazioni del cluster fare clic su Impostazioni.
  3. Attivare o disattivare Controllo di integrità del nodo quindi fare clic su Salva.