可以使用开源 Telegraf 通过帮助程序脚本在 Linux 平台上监控应用程序和操作系统。

前提条件

  • 确认云代理已安装并联机。
  • 确保按照在云代理上启用开源 Telegraf 数据收集 中的步骤操作。
  • 安装 jq 软件包。有关详细信息,请参见 https://stedolan.github.io/jq/download/ 中的 jq 官方文档。
  • 如果虚拟机的 vCenter ServervRealize Operations Cloud 监控,确保 VMTools 版本 >= 10.2。
  • 确保您具有运行以下命令并使用以下软件包的权限:
    • 命令:/bin/bash、awk、sed、vmware-toolbox-cmd、jq、curl
    • 软件包:coreutils(chmod、chown、cat)、net-tools(ip、/dev/tcp、curl、wget)

过程

  1. 在终端安装开源 Telegraf。如果已安装 实例,则可以跳过此步骤。要下载并安装新的 Telegraf 实例,请从 https://www.influxdata.com/time-series-platform/telegraf/https://portal.influxdata.com/downloads/ 查看官方文档并搜索相应的操作系统版本。
  2. 从云代理下载帮助程序脚本 (https://<CloudProxy-IP>/downloads/salt/open_source_telegraf_monitor.sh)。
  3. 导航到下载脚本的目录。
  4. 为 Linux 虚拟机启用脚本的执行权限。
    chmod +x open_source_telegraf_monitor.sh
  5. 运行帮助程序脚本以更新 Telegraf 配置。
    open_source_telegraf_monitor.sh  -t <SAAS_REFRESH_TOKEN> -d <TELEGRAF_CONFIG_DIR>  -c <CP_IP> -e <telegraf_bin_path>
    
    Description of arguments:
    SAAS_REFRESH_TOKEN: CSP Refresh Token of the user/account. For getting a new token, follow - "User/
      Organization Settings >> My Account >> API Tokens >> Generate a New API Token". Mandatory parameter.
      Example: gi7lwabjnvdfiawt4watzksuol8sywrjvg8kabh31mx9x1guepgyhycyx61dqrpq
    TELEGRAF_CONFIG_DIR: Telegraf configuration directory.
    CP_IP: Mention the cloud proxy FQDN/IP address to post metrics.
    telegraf_bin_path - Path of telegraf binary. Example: /usr/bin/telegraf
    
    Example:
    ./open_source_telegraf_monitor.sh -v 10.192.0.1 -t UO2HafB0JMYiMmnppZIo2Zn5jCdDf1YeIXa0E7JXUPoUXF5HN6SK29kdJUibcJMg -c 10.192.0.100 -d /etc/telegraf/telegraf.d  -e /usr/bin/telegraf
    注: 运行帮助程序脚本后,请确保在名为 cloudproxy-http.conf 的给定配置目录( -d 选项)路径中正确设置相应的配置。有关更多详细信息,请参见 示例配置。对于受管虚拟机,可能会看到非受管配置,原因如下:
    • vCenter Server 适配器无法在 vRealize Operations Cloud 中获取虚拟机详细信息。配置 vRealize Operations Cloud vCenter Server 云帐户后,至少等待一到两个收集周期。
    • SAAS_REFRESH_TOKEN 不正确。
    注: -d <TELEGRAF_CONFIG_DIR>:Telegraf 可执行文件具有命令行选项 --config-directory。运行脚本时,必须提供为选项 -d 设置的值。在 Linux 中,该值可以在服务文件 /usr/lib/systemd/system/telegraf.service 中找到。
    注: 默认情况下,InfluxDB 输出插件在 telegraf.conf 文件中处于活动状态,并将数据发送到 influxdb 服务器,以便日志中不会显示有关以下项的多条警告消息:缺少已配置的 influxdb 服务器注释,应对“[[outputs.influxdb]]”行进行注释。会显示以下警告消息: W! [outputs.influxdb] When writing to [http://localhost:8086]: database "telegraf" creation failed: Post "http://localhost:8086/query": dial tcp [::1]:8086: connect: connection refused

    例如:#[[outputs.influxdb]]

    注: 确保 telegraf.conf 文件中的输入插件与相应的操作系统相关。请参见 操作系统的 Telegraf 配置详细信息
  6. 如果 vRealize Operations Cloud 支持的应用程序服务在端点上运行,并且您希望监控该应用程序服务,则使用 Telegraf 必需的输入更新 Telegraf 配置文件或目录。
    有关支持的应用程序服务列表,请参见 说明
    有关配置列表,请参见 支持的应用服务的 Telegraf 配置详细信息
    对于不受支持的应用程序服务,请使用 Telegraf 必需的输入更新 Telegraf 配置文件或目录。
  7. 重新启动 Telegraf 服务。
    systemctl restart telegraf 
    or
    /usr/bin/telegraf -config /etc/telegraf/telegraf.conf -config-directory /etc/telegraf/telegraf.d

下一步做什么

受管虚拟机对象层次结构:如果虚拟机的 vCenter ServervRealize Operations Cloud 监控,则操作系统和应用程序对象将列在相应的虚拟机 > 操作系统对象 > “应用程序服务”实例下。

非受管虚拟机对象层次结构:如果虚拟机的 vCenter Server 不受 vRealize Operations Cloud 监控,则操作系统和应用程序对象将列在环境 > 操作系统环境 > 操作系统对象 > “应用程序服务”实例下。