可以在多个平台上安装并启用 vSphere Bitfusion 客户端。

  • 对于与服务器在同一 vCenter Server 实例中的客户端,可以从 vSphere Bitfusion 插件启用客户端,而无需先生成授权令牌。
  • 对于安装在不同 vCenter Server 实例或裸机计算机上的客户端,可以生成授权令牌并使用该令牌启用单个或多个客户端。
  • 对于安装在 Tanzu Kubernetes Grid (TKG) 容器上的客户端,您可以在 vSphere Bitfusion 插件中添加 Kubernetes 集群和命名空间,创建身份验证令牌并将令牌发布到 Kubernetes 密钥,然后在 Kubernetes Pod 上配置 vSphere Bitfusion 客户端。

您可以通过激活、取消激活、编辑和删除特定的身份验证令牌,创建多个令牌以启用 vSphere Bitfusion 客户端组并管理客户端或客户端组。

下图显示了多个平台上 vSphere Bitfusion 客户端的可用启用选项。

显示激活 vSphere Bitfusion 客户端的不同选项的图表

使用 vSphere Bitfusion 插件启用 vSphere Bitfusion 客户端

可以使用 vSphere Bitfusion 插件启用与 vSphere Bitfusion 服务器安装在同一 vCenter Server 实例中的 vSphere Bitfusion 客户端。

要启用与 vSphere Bitfusion 服务器安装在同一 vCenter Server 实例中的 vSphere Bitfusion 客户端,请使用 vSphere Bitfusion 插件。要添加在 vCenter Server 实例外部安装的客户端,请参见 使用令牌启用 vSphere Bitfusion 客户端

前提条件

过程

  1. vCenter Server 清单中,右键单击 vSphere Bitfusion 客户端的虚拟机,然后选择 Bitfusion > 启用 Bitfusion
  2. Bitfusion 启用对话框中,选择对于客户端,这将允许用户运行 Bitfusion 工作负载单选按钮,然后单击启用
  3. 打开客户端虚拟机的电源。
  4. (可选) 要验证 vSphere Bitfusion 客户端是否已启用,请从 vSphere Bitfusion 客户端运行 bitfusion list_gpus 命令,列出 vSphere Bitfusion 环境中的可用 GPU。

结果

您已成功启用 vSphere Bitfusion 客户端。

下一步做什么

vSphere Bitfusion 客户端中启动应用程序。首次运行后,vSphere Bitfusion 客户端将加入集群。

使用令牌启用 vSphere Bitfusion 客户端

通过使用客户端身份验证令牌,可以启用在裸机计算机或不同 vCenter Server 实例上安装的 vSphere Bitfusion 客户端。

要启用与服务器在不同 vCenter Server 实例中的 vSphere Bitfusion 客户端,必须生成授权令牌,下载相关的 tar 文件,然后在客户端的文件系统中提取文件的内容。

要启用与服务器位于同一 vCenter Server 实例中的客户端,请参见使用 vSphere Bitfusion 插件启用 vSphere Bitfusion 客户端

前提条件

  • 确认已安装 vSphere Bitfusion 4.0 服务器或更高版本。
  • 确认 vSphere Bitfusion 客户端的版本不高于 vSphere Bitfusion 服务器的版本。请参见升级 vSphere Bitfusion
  • 验证 vSphere Bitfusion 客户端是否可以通过网络访问集群中的服务器。

过程

  1. vSphere Client 中,选择菜单 > Bitfusion
  2. 令牌 > 令牌选项卡上,选择创建
    此时将显示 创建令牌对话框。
    1. 输入令牌的名称。
    2. (可选) 选中创建后激活令牌复选框。
    3. 单击创建
  3. 从列表中选择令牌,单击下载,然后将令牌 tar 文件保存到本地计算机。
  4. tar 文件复制到客户端计算机的文件系统中。
  5. 在客户端计算机的终端中,通过运行 sudo usermod -aG bitfusion username 命令将用户添加到 vSphere Bitfusion 组,其中 username 是新用户的名称。
    将用户添加到 vSphere Bitfusion 组是为了确保稍后运行 install.sh 安装程序脚本时具有 /etc/bitfusion/tls~/.bitfusion 文件夹的写入权限。
  6. (可选) 确认用户已成功添加到 vSphere Bitfusion 组。
    1. 注销并登录到客户端计算机的终端。
    2. 在终端中,运行 groups 命令。
    将列出该用户及用户关联的组。 bitfusion 组将显示为列表的一部分。
  7. 提取 tar 文件的内容,然后运行 install.sh 安装程序脚本。
  8. (可选) 验证 tar 文件的内容是否安装在正确的位置。
    文件 位置
    ca.crt /etc/bitfusion/tls
    client.yaml ~/.bitfusion
    servers.conf /etc/bitfusion
  9. (可选) 要验证 vSphere Bitfusion 客户端是否已启用,请从 vSphere Bitfusion 客户端运行 bitfusion list_gpus 命令,列出 vSphere Bitfusion 环境中的可用 GPU。

结果

您已成功启用 vSphere Bitfusion 客户端。

下一步做什么

vSphere Bitfusion 客户端中启动应用程序。首次运行后,vSphere Bitfusion 客户端将加入集群。

在 Kubernetes 集群上启用 vSphere Bitfusion 客户端

启用安装在 Tanzu Kubernetes Grid (TKG) 容器上的 vSphere Bitfusion 客户端。

要启用在 Tanzu Kubernetes Grid (TKG) 容器上安装的 vSphere Bitfusion 客户端,必须在 vSphere Bitfusion 插件中添加 Kubernetes 集群和命名空间,创建身份验证令牌并将令牌发布到 Kubernetes 密钥,然后在 Kubernetes Pod 上配置 vSphere Bitfusion 客户端。
启用在 Kubernetes 集群上安装的 vSphere Bitfusion 客户端。

前提条件

  • 确认已安装 vSphere Bitfusion 4.0 服务器或更高版本。
  • 确认 vSphere Bitfusion 客户端的版本不高于 vSphere Bitfusion 服务器的版本。请参见升级 vSphere Bitfusion
  • 验证 vSphere Bitfusion 客户端是否可以通过网络访问集群中的服务器。

过程

  1. vSphere Client 中,选择菜单 > Bitfusion
  2. 要在 vSphere Bitfusion 插件中添加 Kubernetes 集群,请在令牌 > Kubernetes 集群选项卡上,单击添加
    此时将显示 添加 Kubernetes 集群对话框。
    1. 输入 Kubernetes 集群的名称。
    2. 单击浏览,然后选择 Kubeconfig 文件。
      通常,Kubeconfig 文件位于运行 Kubeadm 工具的计算机的 ~/.kube/config 文件夹中。上载 Kubeconfig 文件后,将显示集群的 IP 地址。
    3. 从 Kubernetes 集群中选择命名空间,然后单击添加
    Kubernetes 集群、命名空间和 IP 地址将显示在 Kubernetes 集群选项卡上。
  3. 要将身份验证令牌发布到 Kubernetes 密钥,请在令牌 > 令牌选项卡上,单击创建
    此时将显示 创建令牌对话框。
    1. 输入客户端身份验证令牌的名称。
    2. 选择一个或多个 Kubernetes 集群和命名空间。
    3. 选中创建后激活令牌复选框。
    4. 选择创建
    新令牌以及发布令牌的 Kubernetes 集群和命名空间将显示在 令牌选项卡上。
  4. 在 Kubernetes pod 上配置 vSphere Bitfusion 客户端。
    1. 在运行 Kubeadm 工具的计算机上,使用以下代码创建 pods.yaml 文件,其中 pod_name 是 Kubernetes pod 的名称,container_name 是 Kubernetes 容器的名称,container_image_path 是 Kubernetes 容器映像的路径。
      apiVersion: v1
      kind: Pod
      metadata:
        name: pod_name
      spec:
        hostNetwork: true
        containers:
        - name: container_name
          image: container_image_path
          command: ["/bin/sh", "-c", "while : ;do curl http://localhost:80/; sleep 3; done"]
          volumeMounts:
          - name: config-files
            mountPath: /etc/bitfusion
          - name: certificate  
            mountPath: /etc/bitfusion/tls  
        volumes:
        - name: config-files
          projected:
            defaultMode: 0640
            sources:
            - secret:
                name: bitfusion-client-secret-client.yml
            - secret:
                name: bitfusion-client-secret-servers.conf
        - name: certificate
          secret:
            secretName: bitfusion-client-secret-ca.crt
            defaultMode: 0640
    2. 运行 kubectl create -f path_to_file --namespace namespace_name 命令,在发布令牌的同一命名空间中创建 Kubernetes pod,其中 path_to_filepods.yaml 文件的路径,namespace_name 是 Kubernetes 命名空间的名称。
    3. 要获取对 Kubernetes pod 的访问权限,请运行 kubectl exec -it pod_name --namespace namespace_name -- bash 命令,其中 pod_name 是 Kubernetes pod 的名称,namespace_name 是 Kubernetes 命名空间的名称。
    4. (可选) 在 Kubernetes 容器中,确认身份验证令牌的文件安装在正确的位置。
      文件 位置
      ca.crt /etc/bitfusion/tls
      client.yaml /etc/bitfusion
      servers.conf /etc/bitfusion
  5. 在 Kubernetes pod 上安装 vSphere Bitfusion 客户端。
  6. 如果 vSphere Bitfusion 客户端的版本为 3.5 或更低版本,请在 Kubernetes pod 中运行以下命令。
    1. 创建 bitfusion 文件夹。
      mkdir ~/.bitfusion
    2. 复制 client.yaml 文件。
      cp /etc/bitfusion/client.yaml ~/.bitfusion/
    3. 提供对 client.yaml 文件的读写访问权限。
      chmod 600 ~/.bitfusion/client.yaml
  7. (可选) 要验证 vSphere Bitfusion 客户端是否已启用,请从 vSphere Bitfusion 客户端运行 bitfusion list_gpus 命令,列出 vSphere Bitfusion 环境中的可用 GPU。

结果

您已成功启用 vSphere Bitfusion 客户端。

下一步做什么

vSphere Bitfusion 客户端中启动应用程序。首次运行后,vSphere Bitfusion 客户端将加入集群。