이 섹션에서는 Orchestrator의 시스템 메트릭 모니터링에 대해 설명합니다.

Orchestrator 시스템 메트릭 모니터링 개요

Orchestrator에는 메트릭 수집기와 시계열 데이터베이스를 포함하는 기본 제공 시스템 메트릭 모니터링 스택이 제공됩니다. 모니터링 스택을 사용하면 Orchestrator에 대한 상태 조건과 시스템 로드를 쉽게 확인할 수 있습니다.

모니터링 스택을 사용하도록 설정하려면 Orchestrator에서 다음 명령을 실행합니다.

sudo /opt/vc/scripts/vco_observability_manager.sh enable 

모니터링 스택의 상태를 확인하려면 다음을 실행합니다.

sudo /opt/vc/scripts/vco_observability_manager.sh status

모니터링 스택을 비활성화하려면 다음을 실행합니다.

sudo /opt/vc/scripts/vco_observability_manager.sh disable

메트릭 수집기

Telegraf는 시스템 메트릭을 수집하기 위한 플러그인을 포함하는 Orchestrator 시스템 메트릭 수집기로 사용됩니다. 다음 메트릭은 기본적으로 사용하도록 설정됩니다.

메트릭 이름 설명
inputs.cpu CPU 사용량에 대한 메트릭입니다.
inputs.mem 메모리 사용량에 대한 메트릭입니다.
inputs.net 네트워크 인터페이스에 대한 메트릭입니다.
inputs.system 시스템 로드 및 가동 시간에 대한 메트릭입니다.
inputs.processes 상태별로 그룹화된 프로세스의 수입니다.
inputs.disk 디스크 사용량에 대한 메트릭입니다.
inputs.diskio 디바이스별 디스크 IO에 대한 메트릭입니다.
inputs.procstat 특정 프로세스에 대한 CPU 및 메모리 사용량입니다.
inputs.nginx Nginx의 기본 상태 정보(ngx_http_stub_status_module)입니다.
inputs.mysql MySQL 서버의 통계 데이터입니다.
inputs.clickhouse 하나 또는 여러 개의 ClickHouse 서버에 대한 메트릭입니다.
inputs.redis 하나 이상의 redis 서버에서 제공하는 메트릭입니다.
inputs.filecount 지정된 디렉토리에 있는 파일의 수 및 총 크기입니다.
inputs.ntpq 표준 NTP 쿼리 메트릭(ntpq executable 필요)입니다.
Inputs.x509_cert SSL 인증서의 메트릭입니다.

더 많은 메트릭을 활성화하거나 사용하도록 설정된 일부 메트릭을 비활성화하려면 다음을 수행하여 Orchestrator의 Telegraf 구성 파일을 편집합니다.

  • sudo vi /etc/telegraf/telegraf.d/system_metrics_input.conf
  • sudo systemctl restart telegraf

시계열 데이터베이스

Telegraf에서 수집하는 시스템 메트릭을 저장하는 데 Prometheus가 사용됩니다. 메트릭 데이터는 최대 3주 동안 데이터베이스에 유지됩니다. 기본적으로, Prometheus는 포트 9090에서 수신합니다. 외부 모니터링 도구가 있는 경우에는 모니터링 UI에서 Orchestrator 시스템 메트릭을 볼 수 있도록 Prometheus 데이터베이스를 소스로 제공합니다.