In questa sezione viene descritto il monitoraggio delle metriche di sistema in Orchestrator.
Panoramica del monitoraggio delle metriche di sistema di Orchestrator
In Orchestrator è integrato uno stack di monitoraggio delle metriche di sistema, che include un agente di raccolta delle metriche e un database delle serie temporali. Lo stack di monitoraggio consente di controllare facilmente lo stato di integrità e il carico di sistema di Orchestrator.
- sudo /opt/vc/scripts/vco_observability_manager.sh enable
Per verificare lo stato dello stack di monitoraggio, eseguire:
- sudo /opt/vc/scripts/vco_observability_manager.sh status
Per disabilitare lo stack di monitoraggio, eseguire:
- sudo /opt/vc/scripts/vco_observability_manager.sh disable
Agente di raccolta delle metriche
Come agente di raccolta delle metriche di sistema di Orchestrator viene utilizzato Telegraf, che include plug-in per raccogliere le metriche di sistema. Per impostazione predefinita, sono abilitate le seguenti metriche.
Nome metrica | Descrizione |
---|---|
inputs.cpu | Metriche relative all'utilizzo della CPU. |
inputs.mem | Metriche relative all'utilizzo della memoria. |
inputs.net | Metriche relative alle interfacce di rete. |
inputs.system | Metriche relative al tempo di attività e al carico del sistema. |
inputs.processes | Numero di processi raggruppati per stato. |
inputs.disk | Metriche relative all'utilizzo del disco. |
inputs.diskio | Metriche relative alle operazioni I/O del disco per dispositivo. |
inputs.procstat | Utilizzo della CPU e della memoria per processi specifici. |
inputs.nginx | Informazioni sullo stato di base di Nginx (ngx_http_stub_status_module). |
inputs.mysql | Dati statistici del server MySQL. |
inputs.clickhouse | Metriche di uno o più server ClickHouse. |
inputs.redis | Metriche di uno o più server Redis. |
inputs.filecount | Numero e dimensioni totali dei file nelle directory specificate. |
inputs.ntpq | Metriche delle query NTP standard (richiede il file eseguibile ntpq). |
Inputs.x509_cert | Metriche di un certificato SSL. |
Per abilitare più metriche o disabilitare alcune metriche abilitate, modificare il file di configurazione di Telegraf in Orchestrator con i seguenti comandi:
- sudo vi /etc/telegraf/telegraf.d/system_metrics_input.conf
- sudo systemctl restart telegraf
Database delle serie temporali
Per archiviare le metriche di sistema raccolte da Telegraf, viene utilizzato Prometheus. I dati delle metriche vengono conservati nel database per tre settimane al massimo. Per impostazione predefinita, Prometheus è in ascolto nella porta 9090. Se si dispone di uno strumento di monitoraggio esterno, specificare il database Prometheus come origine, in modo da poter visualizzare le metriche di sistema di Orchestrator nell'interfaccia utente di monitoraggio.