龙空技术网

VMware vSphere 双活集群(vMSC)方案介绍

青荷露尖520 1579

前言:

目前姐妹们对“虚拟机 独占模式”大致比较关怀,姐妹们都想要了解一些“虚拟机 独占模式”的相关内容。那么小编同时在网上网罗了一些对于“虚拟机 独占模式””的相关内容,希望各位老铁们能喜欢,小伙伴们一起来了解一下吧!

#头条创作挑战赛#

本文介绍的是经VMware官方认证的vSphere Metro Storage Cluster (vMSC)方案,即VMware vSphere双活集群方案。本文介绍的是dell emc vplex 认证的vMSC方案,并参考了VMware 官方kb2007545。

vMSC双活集群简单说明

vSphere Metro Storage Cluster (vMSC) 方案采用的是VMware Compatibility Guide - Partner Verified and Supported Products (PVSP) 中列出了所有受支持的存储厂商的存储设备,然后结合vSphere HA、DRS、vMotion等功能共同部署出来的双活集群方案。

VPLEX介绍

EMC VPLEX 是戴尔EMC专为数据中心存储双活提供的一款存储网关,实现双活原理也不复杂,就是通过vplex Metro的分布式镜像卷(VPLEX Distributed Virtual Volume)功能实现,并提供跨站点的双活应用。vplex Metro由两套vplex local设备组成集群,每个站点的vplex设备都挂载一套存储。通过创建分布式镜像卷为跨设备的镜像卷,两个站点的vplex local设备上各创建一个卷,两个卷的ID一样,可提供在两个地理位置不同的站点同时访问存储设备的权限。

可以创建一个或多个vplex Metro的分布式镜像卷在两个站点的 ESXi 主机之间进行共享。这些卷可以用作裸设备映射 (RDM) 磁盘或者作为共享 VMFS 数据存储。RDM 可用于供虚拟机独占访问并且 VMFS 数据存储可用于置备虚拟机和拆分出其他 vDisk。

VPLEX仲裁

VPLEX Witness 是置备作为 ESXi 主机上的虚拟机的 VPLEX 组件,该 ESXi 主机应该在第三个站点部署。部署 VPLEX Metro Solution 与 VPLEX Witness 使得可以在出现站点故障或者出现群集间链路故障时能够不间断使用存储卷。

创建 VPLEX Distributed Virtual Volume 后,可能会启用每卷首选站点标记或者具有相同首选站点设置的 Distributed Virtual Volume 可能会被放置在同一一致性组中。首选项条件可以是可用性、监视工作人员的出席或者位置等。VPLEX Witness 故障处理语义仅应用于一致性组内的 Distributed Virtual Volume。

vMSC集群配置要求

必须满足这些要求才能支持以下配置:

对于不一致的主机访问配置,两个 VPLEX 群集之间的 IP 网络和群集间网络的最长往返滞后时间不得超过 5 毫秒,而对于一致的主机访问配置,该时间不得超过 1 毫秒。IP 网络支持 VMware ESXi 主机和 VPLEX Management Console。两个 VPLEX 群集之间的接口可以是光纤通道或 IP。对于 VPLEX Geosynchrony 5.2 及更高版本和采用 NMP 和 PowerPath 的 ESXi 5.5,现在所支持的不一致主机访问配置的往返滞后时间最长为 10 毫秒。对于管理和 vMotion 网络,两个数据中心中的 ESXi 主机必须在同一 IP 子网和广播域上具有一个专用网络。最好管理和 vMotion 通讯是在分开的网络上。驻留于其上的虚拟机所用的任何 IP 子网必须可从两个数据中心中的 ESXi 主机访问。该要求非常重要,以便当任意 VMware HA 触发虚拟机重新启动事件时,访问运行于两端 ESXi 主机的虚拟机的客户端可以正常运行。数据存储位置(包括虚拟机所使用的引导设备)必须处于活动状态且可被两个站点中的 ESXi 主机访问。vCenter Server 必须能够连接至/访问两个站点的 ESXi 主机。虚拟机运行在vplex创建的 Distributed Virtual Volume 中。HA 群集中的最大主机数量:对于 5.x 版本,不得超过 32 台;对于 6.x 版本,不得超过 64 台。VPLEX 交叉连接一致性组的配置选项自动恢复必须设置为 true。支持在虚拟机上启用 FT,但 Cluster Witness 服务器除外。对于 VPLEX 6.0 及高级版本,该配置在 VS2 和 VS6 硬件上都受支持。

注意事项:

构成 VMware HA 群集的 ESXi 主机可以分布于两个站点。HA 群集可以在未出现故障的 ESXi 主机上启动虚拟机,ESXi 主机通过其站点的存储路径访问 Distributed Virtual Volume。VPLEX 6.0 及更高版本和 ESXi 5.x/6.x 在该配置中与 VPLEX Witness 一起进行测试。VPLEX 5.x 及更高版本不支持 VPLEX GEO 配置。vMSC 解决方案设计说明

VMware HA/DRS 群集是使用 ESXi 6.x或以上版本的主机跨两个站点创建的,由 vCenter Server 管理。vSphere Management、vMotion 和虚拟机网络是通过使用两个站点之间的冗余网络连接的。假设管理 HA/DRS 群集的 vCenter Server 可以连接至两个站点的 ESXi 主机。该图表提供了如下概述:

基于到 VPLEX 存储群集的主机 SAN 连接,有两种可能的部署类型:

不一致的主机访问 – 该类型的部署涉及任一站点的主机仅通过同一站点存储群集查看存储卷。该图表提供了如下示例:一致的主机访问 (Cross-Connect) – 该部署涉及跨两个站点建立前端 SAN,以便其中一个站点的主机可以查看同一站点以及其他站点的存储群集。对于该类型的部署必须遵循以下最佳做法:前端区域分配应通过此类方式完成,从而将 HBA 端口连接到本地或远程 VPLEX 群集。对于本地及 Metro (非交叉连接):DellEMC 建议使用 PowerPath/VE;或 NMP VMW_PSP_RR (round-robin) 策略,IO 限制设为 1000。

对于交叉连接的 Metro: DellEMC 强烈建议使用 PowerPath/VE;或 NMP VMW_PSP_RR (round-robin) 策略,IO 限制设为 1000。

跨两个数据中心联合的 VPLEX Metro 解决方案向 ESXi 主机提供了分布式存储。假设 ESXi 引导磁盘位于特定于主机的内部驱动器,而不是位于 Distributed Virtual Volume 本身。

理想情况下,虚拟机在 Distributed Virtual Volume 的首选站点运行。

故障场景

故障场景

dell emc vplex故障情况

影响/观察到的 VMware vSphere HA 行为

单一 VPLEX 后端 (BE) 路径故障

VPLEX 使用同一 BE 阵列的备用路径继续运行。对 ESXi 主机公开的 Distributed Virtual Volume 没有影响。

无。

单一前端 (FE) 路径故障

预期 ESXi Server 使用 Distributed Virtual Volume 的备用路径。

无。

站点 A 的 BE 阵列故障

VPLEX 使用站点 B 的阵列继续运行。当阵列从故障中恢复时,站点 A 的存储卷会自动从站点 B 重新同步。

无。

站点 B 的 BE 阵列故障

VPLEX 使用站点 A 的阵列继续运行。当阵列从故障中恢复时,站点 B 的存储卷会自动从站点 A 重新同步。

无。

VPLEX 导向器故障

VPLEX 通过同一 VPLEX 群集上的其他导向器继续提供对 Distributed Virtual Volume 的访问权限。

无。

完整的站点 A 故障

(故障包括站点 A 的所有 ESXi 主机和 VPLEX 群集。)

VPLEX 继续服务未出现故障的站点(站点 B)上的 I/O。当故障站点(站点 A)的 VPLEX 恢复后,会自动从活动站点(站点 B)同步 Distributed Virtual Volume。

在故障站点运行的虚拟机失败。VMware HA 自动在未出现故障的站点重新启动它们。

完整的站点 B 故障

(故障包括站点 A 的所有 ESXi 主机和 VPLEX 群集。)

VPLEX 继续服务未出现故障的站点(站点 A)上的 I/O。当站点 B 的 VPLEX 恢复后,会自动从活动站点(站点 A)同步 Distributed Virtual Volume。

在故障站点运行的虚拟机失败。VMware HA 自动在未出现故障的站点重新启动它们。

多个 ESXi 主机

故障 – 关闭

无。

VMware HA 在 VMware HA 群集内的任意未出现故障的 ESXi 主机上重新启动虚拟机。

多个 ESXi 主机

故障 – 网络断开

无。

HA 继续通过共享数据存储交换群集检测信号。未发生任何虚拟机故障切换。

ESXi 主机遭遇 APD(全部路径异常)–

当 ESXi 主机失去对其存储卷(在这种情况下是 VPLEX 卷)的访问权限时会遇到。

无。

在 APD(全部路径异常)方案中,ESXi 主机必须重新引导以恢复。如果 ESXi Server 重新启动,这将会导致 VMware HA 在 VMware HA 群集内的其他未出现故障的 ESXi Server 上重新启动失败的虚拟机。

VPLEX 站点间链路故障;vSphere 群集管理网络完好

VPLEX 将非首选站点上的 Distributed Virtual Volume 转变为 I/O 故障状态。在首选站点上,Distributed Virtual Volumes 继续提供访问权限。

在首选站点运行的虚拟机不会受到影响。

在非首选站点运行的虚拟机遇到 I/O 故障并显示 PDL 错误。HA 将这些虚拟机故障切换至其他站点。

在一致的主机访问配置中,虚拟机运行不受任何影响,因为 ESXi 主机仍能通过首选站点访问分布式卷。

VPLEX 群集故障

(站点 A 或者站点 B 的 VPLEX 已失败,但是 ESXi 和其他 LAN/WAN/SAN 组件完好。)

继续在未出现故障的站点中的所有卷上服务 I/O。

位于故障站点中的 ESXi 主机遇到 APD 情况。需要重新引导 ESXi 主机以从故障中恢复。

在一致的主机访问配置中,虚拟机运行不受任何影响,因为 ESXi 主机仍能通过首选站点访问分布式卷。

完整的双站点故障

两个站点恢复时,VPLEX 将继续服务 I/O。最佳做法是先恢复 BE 存储阵列,然后是 VPLEX。

所有虚拟机因两个站点均出现故障而失败。

ESXi 主机应仅在 VPLEX 完全恢复且同步 Distributed Virtual Volumes 后恢复。

开启每个站点的 ESXi 主机时,虚拟机会重新启动并恢复正常运行。

一致的主机访问配置中因两个站点均出现故障产生相同影响。

一个站点

(给定 Distributed Virtual Volume 的首选站点)的导向器故障以及另一站点(给定 Distributed Virtual Volume 的辅助站点)的 BE 阵列故障

存在故障导向器的 VPLEX 群集内未出现故障的 VPLEX 导向器将继续提供 Distributed Virtual Volume 的访问权限。

VPLEX 使用首选站点 BE 阵列继续提供 Distributed Virtual Volume 的访问权限。

无。

VPLEX 站点间链路完好;vSphere 群集管理网络故障

无。

HA 群集信号通过共享数据存储交换后每个站点上的虚拟机继续在其各自的主机上运行。

VPLEX 站点间链路故障;vSphere 群集管理网络故障

在给定 Distributed Virtual Volume 的非首选站点上 VPLEX 服务 I/O 失败。卷可以继续访问其首选站点上的 Distributed Virtual Volume。

对于在首选站点中运行的虚拟机,开启的虚拟机继续运行。

这是 HA 裂脑情况。非首选站点认为首选站点的主机已死机并尝试重新启动首选站点的已开启虚拟机。

对于在非首选站点中运行的虚拟机,这些虚拟机将其 I/O 视为失败,然后虚拟机失败。这些虚拟机可以在首选站点上注册并重新启动。

在一致的主机访问配置中,虚拟机运行不受任何影响,因为 ESXi 主机仍能通过首选站点访问分布式卷。HA 信号通过数据存储进行交换。

VPLEX Storage 卷不可用(例如,它意外从存储视图中移除或者 ESXi 启动器意外从存储视图中移除)

VPLEX 继续在卷可用的其他站点上服务 I/O。

如果 I/O 在丢失的设备的上运行,ESXi 会检测到 PDL(永久设备丢失)情况。虚拟机被虚拟机监视器终止,并由 HA 在其他站点上重新启动。

VPLEX 站点间 WAN 链路故障以及同时的 Cluster Witness 到站点 B 链路故障

站点 B 的 Distributed Virtual Volume 上 VPLEX 服务 I/O 失败,并继续服务站点 A 上的 I/O。

发现站点 B 的虚拟机失败。它们可以在站点 A 重新启动。

在一致的主机访问配置中,虚拟机运行不受任何影响,因为站点 B 的 ESXi 主机仍能通过站点 A 访问分布式卷。

VPLEX 站点间 WAN 链路故障以及同时的 Cluster Witness 到站点 A 链路故障

站点 A 的 Distributed Virtual Volume 上 VPLEX 服务 I/O 失败,并继续服务站点 B 上的 I/O。

发现站点 A 的虚拟机失败。它们可以在站点 B 重新启动。

在一致的主机访问配置中,虚拟机运行不受任何影响,因为站点 A 的 ESXi 主机仍能通过站点 B 访问分布式卷。

VPLEX Cluster Witness 故障

VPLEX 继续服务两个站点的 I/O。

无。

VPLEX Management Server 故障

无。

无。

vCenter Server 故障

对运行中的虚拟机或 HA 没有影响。但是,DRS 规则和虚拟机位置未生效。

标签: #虚拟机 独占模式 #虚拟机独占模式快捷键