可以创建备份,以便在出现故障后还原 VMware Cloud Director 环境。

备份主 VMware Cloud Director 设备版本 10.3.1 及更高版本

VMware Cloud Director 10.3.1 及更高版本开始,可以使用 VMware Cloud Director 设备管理用户界面备份主设备。

前提条件

验证集群运行状况是否为“ HEALTHY”。请参见 查看 VMware Cloud Director 设备集群运行状况和故障切换模式

过程

  1. root 用户身份登录到主单元、备用单元或应用程序单元的设备管理 UI,网址为 https://cell_eth0_ip_address:5480
  2. 在左侧面板中,单击备份选项卡。
    备份页面上,可以看到之前备份的列表。
  3. 单击立即备份
  4. 要确认备份,单击保存
    VMware Cloud Director 设备将在 /opt/vmware/vcloud-director/data/transfer/backups 目录中创建备份文件。先前 VMware Cloud Director 版本的备份位于 /opt/vmware/vcloud-director/data/transfer/pgdb-backup 目录中。但是,早期版本的备份与 VMware Cloud Director 10.3.1 及更高版本不兼容。
  5. 备份完成后,单击关闭

结果

新创建的文件将显示在备份列表中。备份名称的格式为 backup-date-time-format.tgz。对于 VMware Cloud Director 设备 10.3.2 及更高版本,备份名称的格式为 backup-date-time-format.zip

下一步做什么

  • 如果您不希望将系统还原到版本 10.3 或更低版本,则可以删除 /opt/vmware/vcloud-director/data/transfer/pgdb-backup 目录中的备份。
  • 如果您不希望将系统还原到版本 10.3.1,则可以删除 /opt/vmware/vcloud-director/data/transfer/backups 目录中的备份。
  • VMware Cloud Director 10.3.2 开始,可以使用 VMware Cloud Director 设备管理用户界面或 VMware Cloud Director 设备 API 删除任何不必要的 10.3.2 及更高版本备份。有关如何使用 VMware Cloud Director 设备 API 的信息,请参见《VMware Cloud Director 设备 API 参考》

备份 VMware Cloud Director 10.3 设备的嵌入式数据库

如果您的 VMware Cloud Director 10.3 环境包含部署了嵌入式 PostgreSQL 数据库的 VMware Cloud Director 设备,则可以从主单元备份 VMware Cloud Director 数据库。生成的 .tgz 文件存储在 NFS 共享传输服务存储位置。

注: 此过程适用于 VMware Cloud Director 版本 10.3。对于 VMware Cloud Director 10.3.1 及更高版本,请参见 备份主 VMware Cloud Director 设备版本 10.3.1 及更高版本

前提条件

验证集群运行状况是否为“ HEALTHY”。请参见 查看 VMware Cloud Director 设备集群运行状况和故障切换模式

过程

  1. root 身份直接或通过 SSH 客户端登录到主单元。
  2. 导航到 /opt/vmware/appliance/bin
  3. 运行 create-db-backup 命令。

结果

在 NFS 共享传输服务存储上的 vcloudapp.nfs_mount.VMware_vCloud_Director/pgdb-backup/ 目录下,可以看到新创建的 db-backup-date_time_format.tgz 文件。该 .tgz 文件包含数据库转储文件以及主单元的 global.propertiesresponses.propertiescertificatesproxycertificatestruststore 文件。

还原主 VMware Cloud Director 设备版本 10.3.1 及更高版本

从版本 10.3.1 开始,要还原主设备,可以使用 VMware Cloud Director 设备管理 UI。如果 HA 集群出现故障(例如,升级失败期间),可以使用备份还原主设备,而不必使用 VM 快照。

前提条件

过程

  1. root 用户身份登录到 https://primary_eth0_ip_address:5480 处新部署主单元的设备管理 UI。
  2. 在左侧面板中,单击从备份还原选项卡。
  3. 输入包含备份目录的路径,例如,remote_target:/data/transfer
    NFS 挂载和包含备份目录的共享必须具有 750 权限和 vcloud.vcloud 所有权。
  4. 验证程序确认 NFS 共享后,单击下一步
  5. 选择要用于还原主设备的备份,然后单击下一步
    默认情况下,仅会显示具有兼容版本的备份。可以按日期对备份进行排序,也可以按设备版本筛选备份。
  6. (可选) 如果 VMware Cloud Director 设备的版本为 10.3.3 或更高版本,请选择要从备份还原的证书。
    对于还原的设备,您可以重用 HTTP 证书和/或控制台代理证书。
  7. 为还原的主设备输入传输共享的路径。
    可以使用同一 NFS 共享,也可以为还原的设备输入新共享。
  8. 在验证程序确认 NFS 共享后,单击还原
  9. 还原操作成功完成后,单击关闭

下一步做什么

  1. 部署或还原其他备用单元和应用程序单元。
    • 要部署其他单元,请参见VMware Cloud Director 设备的部署和初始配置
    • VMware Cloud Director 10.3.3 开始,与还原主设备类似,可以使用 VMware Cloud Director 设备管理 UI 还原其他单元。还原其他单元时,如果 HTTP 和控制台代理证书引用传输共享路径,VMware Cloud Director 会将单元配置为使用与主设备相同的证书。如果 HTTP 和控制台代理证书引用本地路径并具有与 root 相同的 key-password,则 VMware Cloud Director 会将其他单元配置为使用自签名证书。
  2. 如果还原前的故障切换模式为“Automatic”,则必须使用 VMware Cloud Director 设备 API 将其重新设置为“Automatic”。
  3. 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。

    单元 FIPS 模式会自动还原。

还原具有 HA 数据库配置的 VMware Cloud Director 10.3 设备环境

如果备份了具有高可用性数据库配置的 VMware Cloud Director 设备环境中的嵌入式 PostgreSQL 数据库,则可以部署一个新的设备集群并在其中还原此设备数据库。

还原工作流包括三个主要阶段。

  • 从传输服务 NFS 共享存储复制嵌入式数据库备份 .tar 文件。
  • 将数据库还原到嵌入式数据库的主单元和备用单元。
  • 部署任何所需的应用程序单元。

必备条件

过程

  1. 在主单元和备用单元上,以 root 身份登录,然后运行以下命令以停止 VMware Cloud Director 服务。
    service vmware-vcd stop
  2. 在主单元和备用单元上,将备份 .tar 文件复制到 /tmp 文件夹。

    如果 /tmp 文件夹上的可用空间不足,请在其他位置存储 .tar 文件。

  3. 在主单元和备用单元上,解压缩位于 /tmp 的备份文件。
    tar -zxvf db-backup-date_time_format.tgz

    /tmp 文件夹中,您会看到提取出来的 global.propertiesresponses.propertiescertificates.pemcertificates.keyproxycertficates.pemproxycertficates.keytruststore.pem 以及名为 vcloud_date_time_format 的数据库转储文件。

    注: truststore.pem 文件仅适用于 VMware Cloud Director 10.2.2 及更高版本。
  4. 仅在主单元上,以 root 身份登录到控制台并运行以下命令。
    1. 丢弃 vcloud 数据库。
      sudo -i -u postgres /opt/vmware/vpostgres/current/bin/psql -c 'DROP DATABASE vcloud;'
    2. 运行 pg_restore 命令。
      sudo -i -u postgres /opt/vmware/vpostgres/current/bin/pg_restore -C -d postgres /tmp/vcloud_date_time_name
  5. 在主单元和备用单元上,保存配置数据文件的副本,进行替换,然后重新配置并启动 VMware Cloud Director 服务。
    1. 备份属性、证书、私钥和信任存储区文件。

      global.propertiesresponses.propertiescertificates.pemcertificates.keyproxycertificates.pemproxycertificates.keyuser.http.pemuser.http.keyuser.consoleproxy.pemuser.consoleproxy.keytruststore.pem 文件位于 /opt/vmware/vcloud-director/etc/

      cd /opt/vmware/vcloud-director/etc
      mkdir -p backup
      cp global.properties responses.properties certificates.* proxycertificates.* truststore.* user.* backup
    2. 复制并替换步骤 3 中提取的备份文件中的属性、证书、私钥和信任存储区文件。
      cd /tmp
      cp global.properties responses.properties certificates.* proxycertificates.* truststore.* user.* /opt/vmware/vcloud-director/etc/
    3. 运行以下命令,重新配置 VMware Cloud Director 服务。
      /opt/vmware/vcloud-director/bin/configure --unattended-installation --database-type postgres --database-user vcloud \
      --database-password db_password_new_primary --database-host eth1_ip_new_primary --database-port 5432 \
      --database-name vcloud --uuid --cert /opt/vmware/vcloud-director/etc/user.http.pem --key /opt/vmware/vcloud-director/etc/user.http.key --key-password key_password --consoleproxy-cert /opt/vmware/vcloud-director/etc/user.consoleproxy.pem --consoleproxy-key /opt/vmware/vcloud-director/etc/user.consoleproxy.key --consoleproxy-key-password key_password --primary-ip appliance_eth0_ip \
      --console-proxy-ip appliance_eth0_ip --console-proxy-port-https 8443 
      /opt/vmware/vcloud-director/bin/cell-management-tool reconfigure-database --database-ssl true
      其中:
      • --key-password--consoleproxy-key-password 选项与设备上私钥的密码一致。私钥密码可能是在设备部署期间使用的 root 密码。
      • --database-password 选项与在 VMware Cloud Director 设备管理 UI (https://appliance_eth0_ip:5480) 中设置设备时设置的数据库密码一致。
      • --database-host 选项与主数据库设备的 eth1 网络 IP 地址一致。
      • --primary-ip 值与还原的设备单元的 eth0 网络 IP 地址一致。这不是主数据库单元的 IP 地址。
      • --console-proxy-ip 选项与要还原的设备的 eth0 网络 IP 地址匹配。

      有关故障排除信息,请参见迁移或还原到 VMware Cloud Director 设备时,重新配置 VMware Cloud Director 服务失败

    4. 运行以下命令,启动 VMware Cloud Director 服务。
      service vmware-vcd start

      可以在 /opt/vmware/vcloud-director/logs/cell.log 中监控单元的启动进度。

  6. (可选) 部署任何其他应用程序单元。请参见VMware Cloud Director 设备的部署和初始配置
  7. 如果新设备使用的 IP 不同于要替换的原始设备,则必须更新 VMware Cloud Director 服务器组前面的负载均衡器配置,使其包含新设备的 IP。
  8. 服务器组的所有单元完成启动过程后,验证 VMware Cloud Director 环境还原是否成功。
    1. 使用新服务器组中任何单元的 eth0 网络 IP 地址打开 VMware Cloud Director Service Provider Admin Portal,即 https://et0_IP_new_cell/provider

      如果根据步骤 7 更新了负载均衡器配置,则必须使用服务器组的公用地址访问 Service Provider Admin Portal

    2. 使用现有系统管理员凭据登录到 Service Provider Admin Portal
    3. 验证您的 vSphere 和云资源在新环境中是否可用。
  9. 成功验证数据库还原后,使用 Service Provider Admin Portal 删除属于旧 VMware Cloud Director 环境的已断开连接单元。
    1. 从顶部导航栏的资源下,选择云资源
    2. 在左侧面板中,单击云单元
    3. 选择非活动单元,然后单击取消注册
  10. 如果还原前的故障切换模式为“Automatic”,则必须使用 VMware Cloud Director 设备 API 将其重新设置为“Automatic”。
  11. 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。

    单元 FIPS 模式会自动还原。