ESXi 与 SAN 配合使用可提高灵活性、效率以及可靠性。将 ESXi 与 SAN 配合使用还支持集中式管理、故障切换和负载均衡技术。

下面是将 ESXi 与 SAN 配合使用的优点:

  • 您可安全地存储数据并配置多个指向存储的路径,从而避免出现单一故障点。
  • ESXi 主机可访问来自多个存储阵列(包括不同供应商的阵列)的存储设备。
  • 将 SAN 与 ESXi 系统配合使用可将故障恢复能力扩展到服务器。使用 SAN 存储时,所有应用程序都可在原始主机出现故障后在其他主机上立即重新启动。
  • 可以使用 VMware vMotion 执行虚拟机的实时迁移。
  • 如果虚拟机的主机出现故障,可将 VMware High Availability (HA) 与 SAN 结合使用,在另一台服务器上以虚拟机的最后已知状态重新启动虚拟机。
  • 可使用 VMware Fault Tolerance (FT) 复制两台不同主机上的受保护虚拟机。如果首选主机出现故障,虚拟机可在辅助主机上继续不间断地运行。
  • 使用 VMware Distributed Resource Scheduler (DRS) 将虚拟机从一台主机迁移到另一台主机以实现负载均衡。由于存储位于共享 SAN 阵列,因此应用程序可继续无缝运行。
  • 如果使用 VMware DRS 集群,请将 ESXi 主机置于维护模式,以便系统将所有正在运行的虚拟机迁移到其他 ESXi 主机。随后便可在原始主机上执行升级或其他维护操作。

VMware 虚拟机的可移植性和封装与此存储的共享特性相辅相成。当虚拟机位于基于 SAN 的存储上时,您可以快速关闭一台服务器上的虚拟机并在另一台服务器上将其启动,或在一台服务器上将其挂起并在同一网络上的另一台服务器上恢复操作。此功能可实现在迁移计算资源的同时保持一致的共享访问。

ESXi 和 SAN 用例

与 SAN 配合使用时,ESXi 可从 Storage vMotion、Distributed Resource Scheduler (DRS)、High Availability 等多个 vSphere 功能中受益。

ESXi 与 SAN 配合使用对于以下任务非常有效:

存储整合与存储布局的简化
如果使用多台主机,且每台主机都运行多个虚拟机,那么主机上的存储不再够用。您可能需要使用外部存储。SAN 可提供简单的系统架构和其他优点。
零停机时间维护
执行 ESXi 主机或基础架构维护时,使用 vMotion 将虚拟机迁移到其他主机。如果共享存储位于 SAN 上,您无需中断虚拟机的用户服务便可执行维护。虚拟机工作进程在整个迁移过程中继续执行。
负载均衡
可以将主机添加到 DRS 集群,该主机的资源将成为集群资源的一部分。将持续监控集群内所有主机和虚拟机的 CPU 和内存资源的分布情况和使用情况。DRS 会将这些衡量指标与理想状态下的资源使用情况进行比较。理想状态下的使用情况会考虑集群内资源池和虚拟机的属性、当前需求以及不均衡目标。如果需要,DRS 会执行或建议执行虚拟机迁移。
灾难恢复
您可以使用 VMware High Availability 将多台 ESXi 主机配置为一个集群。集群为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。
简化阵列迁移和存储升级
如果购买了新的存储系统,可以使用 Storage vMotion 执行实时迁移,将虚拟机从现有存储迁移到新的目标位置。执行迁移时,可以不中断虚拟机。

将 SAN 存储与 ESXi 配合使用的细节

将 SAN 与 ESXi 主机配合使用在很多方面有别于传统的 SAN 使用。

  • 您无法使用 SAN 管理工具访问位于该存储上的虚拟机操作系统。使用传统工具,只能监控 VMware ESXi 操作系统。可以使用 vSphere Client 监控虚拟机。
  • 通过 SAN 管理工具可看到的 HBA 属于 ESXi 系统(而不是属于虚拟机)。
  • 通常,ESXi 系统会为您执行多路径。

决定 LUN 的大小和数目

在格式化包含 VMFS 数据存储的 LUN 之前,必须规划如何设置 ESXi 系统的存储。

决定 LUN 的大小和数目,需要考虑以下注意事项:

  • 每个 LUN 必须具有正确的 RAID 级别和存储特性,适用于在使用该 LUN 的虚拟机中运行的应用程序。
  • 每个 LUN 必须仅包含一个 VMFS 数据存储。
  • 如果多台虚拟机访问同一个 VMFS,请使用磁盘份额区分虚拟机的优先级。

出于以下原因,您可能需要较少、较大的 LUN:

  • 在不向存储管理员要求更多空间的情况下,使创建虚拟机的灵活性更大。
  • 使调整虚拟磁盘大小、执行快照等等的灵活性更大。
  • 使要管理的 VMFS 数据存储变得更少。

出于以下原因,您可能需要较多、较小的 LUN:

  • 减少存储空间浪费。
  • 不同的应用程序可能需要不同的 RAID 特性。
  • 为每个 LUN 设置多路径策略和磁盘份额,从而增加灵活性。
  • 使用 Microsoft 集群服务要求每个集群磁盘资源位于各自的 LUN 中。
  • 由于对单个卷的争用情况较少,因此性能更佳。

当虚拟机的存储特性不可用时,可能无法轻松确定要置备的 LUN 的数目和大小。可以使用预测性或自适应性方案决定 LUN 大小和数量。

使用预测性方案来决定 LUN 的大小和数目

使用预测性方法的试验。

过程

  1. 置备若干具有不同存储特性的 LUN。
  2. 在每个 LUN 上创建一个 VMFS 数据存储,并依照相应特性标记各个数据存储。
  3. 创建虚拟磁盘以包含在 LUN 上创建的 VMFS 数据存储中的虚拟机应用程序数据,这些 LUN 具有满足其上应用程序要求的 RAID 级别。
  4. 使用磁盘份额来区别高优先级虚拟机与低优先级虚拟机。
    注: 磁盘份额仅表示给定主机内的比例。分配给某一主机上虚拟机的份额并不影响其他主机上的虚拟机。
  5. 运行应用程序以确定虚拟机性能是否可接受。

使用自适应性方案来决定 LUN 的大小和数目

可以使用自适应性方案决定 LUN 的大小和数目。

过程

  1. 置备一个较大的 LUN(RAID 1+0 或 RAID 5),同时启用写入缓存。
  2. 在该 LUN 上创建 VMFS。
  3. 在 VMFS 上创建四个或五个虚拟磁盘。
  4. 运行应用程序以确定磁盘性能是否可接受。

结果

如果性能可接受,您可以在 VMFS 上再添加虚拟磁盘。如果性能不可接受,请新建大的 LUN(可能采用其他 RAID 级别)并重复此过程。使用迁移,以防止在重新创建 LUN 时丢失虚拟机数据。

选择虚拟机位置

如果您要设法优化虚拟机的性能,存储位置是个重要因素。根据您的存储需求,您可以选择具有高性能和高可用性的存储,也可以选择具有低性能的存储。

根据多种因素,存储可分为不同级别:

  • 高端。提供高性能和高可用性。可能提供内置快照,便于备份及时间点 (PiT) 还原。支持复制、完全存储处理器冗余和 SAS 驱动器。使用高成本心轴。
  • 中端。提供中等程度的性能、较低可用性、部分存储处理器冗余和 SCSI 或 SAS 驱动器。可能提供快照。使用中等成本的心轴。
  • 低端。提供低性能及少许内部存储冗余。使用低端 SCSI 驱动器或 SATA。

并非所有虚拟机在整个生命周期内都必须位于性能最高和可用性最佳的存储上。

决定某个虚拟机的放置位置时,需要考虑以下注意事项:

  • 虚拟机的重要程度
  • 性能和可用性要求
  • PiT 还原要求
  • 备份和复制要求

由于重要程度发生改变或技术发展,虚拟机在其整个生命周期过程中可能变更级别。重要程度是相对的,并且可能由于各种原因(包括组织、操作流程、法规要求及灾难规划等方面的变化)而改变。

第三方管理应用程序

可以将第三方管理应用程序与 ESXi 主机配合使用。

大多数 SAN 硬件都附送存储管理软件。在许多情况下,此软件是一个 Web 应用程序,可与连接到网络的任何 Web 浏览器配合使用。在其他情况下,此软件通常在存储系统或单个服务器上运行,独立于使用 SAN 作为存储的服务器。

此第三方管理软件可用于执行下列任务:

  • 存储阵列管理,包括 LUN 创建、阵列缓存管理、LUN 映射以及 LUN 安全。
  • 设置复制、检查点、快照或镜像。

如果在虚拟机上运行 SAN 管理软件,您可享有虚拟机的一系列优点,包括使用 vMotion 和 VMware HA 进行故障切换。但是,由于附加了间接级别,管理软件可能看不到 SAN。在这种情况下,可以使用 RDM。

注: 虚拟机能否成功运行管理软件取决于特定的存储系统。

SAN 存储备份注意事项

具有正确的备份策略是 SAN 管理的最重要的方面之一。在 SAN 环境中,备份有两个目的。第一个目的是将联机数据归档至脱机介质。可对所有联机数据按时间表定期重复执行此过程。第二个目的是提供对脱机数据的访问,用于从故障中恢复。例如,数据库恢复通常需要检索当前未联机的已存档日志文件。

计划备份取决于多种因素:

  • 关键应用程序的标识,这些应用程序在给定时间内需要较频繁地备份。
  • 恢复点和恢复时间目标。考虑恢复点必须具有的精确度,以及愿意为此而等待的时间长度。
  • 与数据关联的变化率 (Rate of Change, RoC)。例如,如果使用同步/异步复制,RoC 将影响主存储设备与辅助存储设备间所需带宽的大小。
  • 对 SAN 环境、存储性能以及其他应用程序的总体影响。
  • SAN 上高峰流量时段的标识。计划于这些高峰时段执行的备份可降低应用程序和备份过程的运行速度。
  • 计划数据中心内所有备份所需的时间。
  • 备份单个应用程序所需的时间。
  • 存档数据的资源可用性,如脱机介质访问。

设计备份策略时要包括各应用程序的恢复时间目标。也就是考虑执行备份所需的时间和资源。例如,如果已计划的备份要存储过多数据,导致恢复需要大量时间,那么请检查已计划的备份。增加执行备份的频率,这可减少每次备份的数据,从而缩短恢复时间。

如果应用程序需要在某一时帧内恢复,则备份过程必须提供时间表及特定数据处理以满足此需求。快速恢复可能需要使用驻留在联机存储上的恢复卷。此过程有助于最大限度避免或完全避免通过访问速度较慢的脱机介质来获取丢失的数据组件。

使用第三方备份软件包

可以使用第三方备份解决方案来保护虚拟机中的系统、应用程序和用户数据。

VMware 提供的 Storage API - Data Protection 可以与第三方产品一起使用。使用这些 API 时,第三方软件可以执行备份,而无需在 ESXi 主机上加载备份任务的处理。

使用 Storage API - Data Protection 的第三方产品可以执行以下备份任务:
  • 对虚拟机执行完整、差异、增量映像备份以及还原。
  • 对使用受支持的 Windows 和 Linux 操作系统的虚拟机执行文件级备份。
  • 通过对运行受支持的 Microsoft Windows 操作系统的虚拟机使用 Microsoft 卷影复制服务 (Volume Shadow Copy Services, VSS),确保数据一致性。

因为 Storage API - Data Protection 使用 VMFS 的快照功能,所以备份时不需要停止虚拟机。这些备份是不间断的,可以随时执行,因此不需要更长的备份时段。

有关 Storage API - Data Protection 及与备份产品集成的信息,请参见 VMware KB 文章 1021175