Monitoraggio delle metriche di sistema

In questa sezione viene descritto il monitoraggio delle metriche di sistema in Orchestrator.

Panoramica del monitoraggio delle metriche di sistema di Orchestrator

In Orchestrator è integrato uno stack di monitoraggio delle metriche di sistema, che include un agente di raccolta delle metriche e un database delle serie temporali. Lo stack di monitoraggio consente di controllare facilmente lo stato di integrità e il carico di sistema di Orchestrator.

Per abilitare lo stack di monitoraggio, eseguire il comando seguente in Orchestrator:

sudo /opt/vc/scripts/vco_observability_manager.sh enable

Per verificare lo stato dello stack di monitoraggio, eseguire:

sudo /opt/vc/scripts/vco_observability_manager.sh status

Per disattivare lo stack di monitoraggio, eseguire:

sudo /opt/vc/scripts/vco_observability_manager.sh disable

Agente di raccolta delle metriche

Come agente di raccolta delle metriche di sistema di Orchestrator viene utilizzato Telegraf, che include plug-in per raccogliere le metriche di sistema. Per impostazione predefinita, sono abilitate le seguenti metriche.


Nome metrica	Descrizione
inputs.cpu	Metriche relative all'utilizzo della CPU.
inputs.mem	Metriche relative all'utilizzo della memoria.
inputs.net	Metriche relative alle interfacce di rete.
inputs.system	Metriche relative al tempo di attività e al carico del sistema.
inputs.processes	Numero di processi raggruppati per stato.
inputs.disk	Metriche relative all'utilizzo del disco.
inputs.diskio	Metriche relative alle operazioni I/O del disco per dispositivo.
inputs.procstat	Utilizzo della CPU e della memoria per processi specifici.
inputs.nginx	Informazioni sullo stato di base di Nginx (ngx_http_stub_status_module).
inputs.mysql	Dati statistici del server MySQL.
inputs.clickhouse	Metriche di uno o più server ClickHouse.
inputs.redis	Metriche di uno o più server Redis.
inputs.filecount	Numero e dimensioni totali dei file nelle directory specificate.
inputs.ntpq	Metriche delle query NTP standard (richiede il file eseguibile ntpq).
Inputs.x509_cert	Metriche di un certificato SSL.

Per attivare più metriche o disattivare alcune metriche abilitate, modificare il file di configurazione di Telegraf in Orchestrator con i seguenti comandi:

sudo vi /etc/telegraf/telegraf.d/system_metrics_input.conf
sudo systemctl restart telegraf

Database delle serie temporali

Per archiviare le metriche di sistema raccolte da Telegraf, viene utilizzato Prometheus. I dati delle metriche vengono conservati nel database per tre settimane al massimo. Per impostazione predefinita, Prometheus è in ascolto nella porta 9090. Se si dispone di uno strumento di monitoraggio esterno, specificare il database Prometheus come origine, in modo da poter visualizzare le metriche di sistema di Orchestrator nell'interfaccia utente di monitoraggio.