In questa sezione viene descritto il monitoraggio delle metriche di sistema in Orchestrator.

Panoramica del monitoraggio delle metriche di sistema di Orchestrator

In Orchestrator è integrato uno stack di monitoraggio delle metriche di sistema, che include un agente di raccolta delle metriche e un database delle serie temporali. Lo stack di monitoraggio consente di controllare facilmente lo stato di integrità e il carico di sistema di Orchestrator.

Per abilitare lo stack di monitoraggio, eseguire il comando seguente in Orchestrator:
  • sudo /opt/vc/scripts/vco_observability_manager.sh enable

Per verificare lo stato dello stack di monitoraggio, eseguire:

  • sudo /opt/vc/scripts/vco_observability_manager.sh status

Per disabilitare lo stack di monitoraggio, eseguire:

  • sudo /opt/vc/scripts/vco_observability_manager.sh disable

Agente di raccolta delle metriche

Come agente di raccolta delle metriche di sistema di Orchestrator viene utilizzato Telegraf, che include plug-in per raccogliere le metriche di sistema. Per impostazione predefinita, sono abilitate le seguenti metriche.

Nome metrica Descrizione
inputs.cpu Metriche relative all'utilizzo della CPU.
inputs.mem Metriche relative all'utilizzo della memoria.
inputs.net Metriche relative alle interfacce di rete.
inputs.system Metriche relative al tempo di attività e al carico del sistema.
inputs.processes Numero di processi raggruppati per stato.
inputs.disk Metriche relative all'utilizzo del disco.
inputs.diskio Metriche relative alle operazioni I/O del disco per dispositivo.
inputs.procstat Utilizzo della CPU e della memoria per processi specifici.
inputs.nginx Informazioni sullo stato di base di Nginx (ngx_http_stub_status_module).
inputs.mysql Dati statistici del server MySQL.
inputs.clickhouse Metriche di uno o più server ClickHouse.
inputs.redis Metriche di uno o più server Redis.
inputs.filecount Numero e dimensioni totali dei file nelle directory specificate.
inputs.ntpq Metriche delle query NTP standard (richiede il file eseguibile ntpq).
Inputs.x509_cert Metriche di un certificato SSL.

Per abilitare più metriche o disabilitare alcune metriche abilitate, modificare il file di configurazione di Telegraf in Orchestrator con i seguenti comandi:

  • sudo vi /etc/telegraf/telegraf.d/system_metrics_input.conf
  • sudo systemctl restart telegraf

Database delle serie temporali

Per archiviare le metriche di sistema raccolte da Telegraf, viene utilizzato Prometheus. I dati delle metriche vengono conservati nel database per tre settimane al massimo. Per impostazione predefinita, Prometheus è in ascolto nella porta 9090. Se si dispone di uno strumento di monitoraggio esterno, specificare il database Prometheus come origine, in modo da poter visualizzare le metriche di sistema di Orchestrator nell'interfaccia utente di monitoraggio.