本节介绍了 Orchestrator 上的系统衡量指标监控。
Orchestrator 系统衡量指标监控概览
Orchestrator 具有内置的系统衡量指标监控堆栈,其中包括衡量指标收集器和时间序列数据库。通过使用监控堆栈,您可以轻松检查 Orchestrator 的运行状况和系统负载。
要启用监控堆栈,请在 Orchestrator 上运行以下命令:
sudo /opt/vc/scripts/vco_observability_manager.sh enable
要检查监控堆栈的状态,请运行:
sudo /opt/vc/scripts/vco_observability_manager.sh status
要停用监控堆栈,请运行:
sudo /opt/vc/scripts/vco_observability_manager.sh disable
衡量指标收集器
Telegraf 用作 Orchestrator 系统衡量指标收集器,其中包括用于收集系统衡量指标的插件。默认情况下,将启用以下衡量指标。
衡量指标名称 | 描述 |
---|---|
inputs.cpu | 有关 CPU 使用情况的衡量指标。 |
inputs.mem | 有关内存使用情况的衡量指标。 |
inputs.net | 有关网络接口的衡量指标。 |
inputs.system | 有关系统负载和正常运行时间的衡量指标。 |
inputs.processes | 按状态分组的进程数。 |
inputs.disk | 有关磁盘使用情况的衡量指标。 |
inputs.diskio | 有关设备的磁盘 IO 的衡量指标。 |
inputs.procstat | 特定进程的 CPU 和内存使用情况。 |
inputs.nginx | Nginx 的基本状态信息 (ngx_http_stub_status_module)。 |
inputs.mysql | 来自 MySQL 服务器的统计数据。 |
inputs.clickhouse | 来自一个或多个 ClickHouse 服务器的衡量指标。 |
inputs.redis | 来自一个或多个 Redis 服务器的衡量指标。 |
inputs.filecount | 指定目录中的文件数量和总大小。 |
inputs.ntpq | 标准 NTP 查询衡量指标(需要 ntpq 可执行文件)。 |
Inputs.x509_cert | 来自 SSL 证书的衡量指标。 |
要激活更多衡量指标或停用某些已启用的衡量指标,请通过以下方式在 Orchestrator 上编辑 Telegraf 配置文件:
- sudo vi /etc/telegraf/telegraf.d/system_metrics_input.conf
- sudo systemctl restart telegraf
时间序列数据库
Prometheus 用于存储 Telegraf 收集的系统衡量指标。衡量指标数据将在数据库中保留最多三周。默认情况下,Prometheus 侦听端口 9090。如果您使用外部监控工具,请提供 Prometheus 数据库以作为源,以便您可以在监控 UI 上查看 Orchestrator 系统衡量指标。