可以使用开源 Telegraf 通过帮助程序脚本在 Linux 平台上监控应用程序和操作系统。

帮助程序脚本仅在以下操作系统上进行了测试:
  • CentOS 7.x 和 CentOS 8.x
  • RHEL 7.x 和 RHEL 8.x
  • SUSE 12.x 和 SUSE 15.x
  • OEL7.x 和 OEL 8.x
  • Ubuntu 16.x、Ubuntu 18.x、Ubuntu 20.x 和 Ubuntu 22.x
  • VMware Photon Linux

前提条件

  • 安装 jq 软件包。有关详细信息,请参见 https://stedolan.github.io/jq/download/ 中的 jq 官方文档。
  • 如果 vCenter Server 虚拟机受 VMware Aria Operations 监控,确保 VMTools 版本 >= 10.2。vmware-toolbox-cmd 仅对 vCenter Server 虚拟机为必需。
  • 确保您具有运行以下命令并使用以下软件包的权限:
    • 命令:/bin/bash、awk、sed、vmware-toolbox-cmd、jq、curl
    • 软件包:coreutils(chmod、chown、cat)、net-tools(ip、/dev/tcp、curl、wget)
  • 云代理目前仅支持 IPv4。
  • 确保 Internet 已激活。
  • 确保云代理已在 VMware Aria Operations 中启动并处于联机状态。对于收集器组,请确保已激活应用程序监控高可用性的收集器组中至少有一个云代理已在 VMware Aria Operations 中启动并联机。
  • 确认解压缩的版本为 6.0-20.el7 或更高版本。
  • vCenter Server 虚拟机、AWS EC2 实例、Azure 虚拟机或物理服务器上必须存在uuidgen 软件包。
  • vCenter Server 虚拟机、AWS EC2 实例、Azure 虚拟机或物理服务器必须有权访问云代理的端口 8443 和 443 或已激活应用程序监控高可用性的收集器组的虚拟 IP。

过程

  1. 从云代理 (https://<CloudProxy-IP>/downloads/salt/telegraf-utils.sh) 下载帮助程序脚本。
    注: 在上述指定命令和位置中使用 <CloudProxy-IP> 的相关云代理 IP 地址。对于已激活应用程序监控高可用性的收集器组,请提供虚拟 IP。
  2. 导航到下载脚本的目录。
  3. 为 Linux 虚拟机激活脚本的执行权限。
    chmod +x telegraf-utils.sh
  4. 运行帮助程序脚本以更新 Telegraf 配置。
    telegraf-utils.sh  opensource -c cloud_proxy_ip_or_collector_group_name -t token -d telegraf_conf_dir -e telegraf_bin_path [-g gateway_url -a csp_auth_url]
        
    Description of arguments:
          -c : [REQUIRED] cloud_proxy_ip_or_collector_group_name - Cloud Proxy IP or Collector Group Name
           -t : [REQUIRED] token - CSP Refresh Token of the user/account. For getting a new token, 
              follow - User/Organization Settings >> My Account >> API Tokens >> Generate a New API Token.
              Example: gi7lwabjnvdfiawt4watzksuol8sywrjvg8kabh31mx9x1guepgyhycyx61dqrpq
          
          -d : [REQUIRED] telegraf_conf_dir - Telegraf configuration directory and it is required argument. ex: /etc/telegraf/telegraf.d
          -e : [REQUIRED] telegraf_bin_path - Path of telegraf executable ex: /usr/bin/telegraf
          
          -g : [OPTIONAL] [SAAS-SPECIFIC] gateway_url - argument to override default VMware Aria Operations SaaS gateway URL
          -a : [OPTIONAL] [SAAS-SPECIFIC] csp_auth_url - argument to override default CSP authentication URL
    
    
    Example: /bin/bash telegraf-utils.sh opensource -t gi7lwabjnvdfiawt4watzksuol8sywrjvg8kabh31mx9x1guepgyhycyx61dqrpq -c 10.10.10.101 -d /etc/telegraf/telegraf.d -e /usr/bin/telegraf 
    注: 运行帮助程序脚本后,请确保在名为 cloudproxy-http.conf 的给定配置目录( -d 选项)路径中正确设置相应的配置。有关更多详细信息,请参见 示例配置对于受管 vCenter Server 虚拟机、AWS EC2 实例或 Azure 虚拟机,可能会显示非受管配置,原因如下
    • 相应地,vCenter Server、AWS 或 Azure 适配器不在 VMware Aria Operations 中提供 vCenter Server 虚拟机、AWS EC2 实例或 Azure 虚拟机详细信息。配置 VMware Aria Operations vCenter Server 云帐户后,至少等待一到两个收集周期。
    • SAAS_REFRESH_TOKEN 不正确。
    注: 默认情况下,InfluxDB 输出插件在 telegraf.conf 文件中处于活动状态,并将数据发送到 influxdb 服务器,以便日志中不会显示有关以下项的多条警告消息:缺少已配置的 influxdb 服务器注释,应对“[[outputs.influxdb]]”行进行注释。会显示以下警告消息: W! [outputs.influxdb] When writing to [http://localhost:8086]: database "telegraf" creation failed: Post "http://localhost:8086/query": dial tcp [::1]:8086: connect: connection refused

    例如:#[[outputs.influxdb]]

    注: 确保 telegraf.conf 文件中的输入插件与相应的操作系统相关。请参见 操作系统的 Telegraf 配置详细信息
    注: 默认网关 URL 为 https://www.mgmt.cloud.vmware.com/vrops-cloud,默认身份验证 URL 为 https://console.cloud.vmware.com/csp/gateway/am/api/auth/api-tokens/authorize。如果身份验证 URL 和网关 URL 不为默认设置,请提供相应参数(-g 和 -a)。
  5. 重新启动 Telegraf 服务。
    systemctl restart telegraf 
    or
    /usr/bin/telegraf -config /etc/telegraf/telegraf.conf -config-directory /etc/telegraf/telegraf.d

下一步做什么

受管虚拟机对象层次结构
  • 如果 vCenter Server 虚拟机受 VMware Aria Operations 监控,则操作系统和应用程序对象将位于相应虚拟机 > 操作系统对象 > “应用程序服务”实例下。
  • 如果 Azure 虚拟机受 VMware Aria Operations 监控,则操作系统和应用程序对象将位于相应 Azure 虚拟机 > 操作系统对象 > “应用程序服务”实例下。
  • 如果 AWS EC2 实例受 VMware Aria Operations 监控,则操作系统和应用程序对象将位于相应 AWS EC2 实例 > 操作系统对象 > “应用程序服务”实例下。

不受 VMware Aria Operations 监控的计算机如果 vCenter Server 虚拟机、AWS EC2 实例、Azure 虚拟机或物理服务器不受 VMware Aria Operations 监控,则操作系统和应用程序对象将列在环境 > 端点 > 操作系统对象 > “应用服务”实例下。

查看收集的数据:收集数据并将其显示在管理 Telegraf 代理页面中。要查看详细信息,可以从管理 Telegraf 代理页面中按代理类型 > 开源代理进行筛选。