如何应对云计算环境下 VMware 虚拟机备份挑战?
ESX/ESXi 主机上运行的虚拟机可以跟踪更改了的磁盘扇区。 此功能被称为块修改跟踪,记录变更块(CBT)[5]。CBT是备份系统高效备份的关键,能显著提高备份速度,降低备份数据存储空间。在许多文件系统上,CBT在两个变更集 ID 之间识别修改了的磁盘扇区。在VMFS分区上,CBT还可以识别所有正在使用的磁盘扇区。可从虚拟机外部到虚拟化层中对虚拟磁盘的块修改进行跟踪。当软件执行备份时,它可以请求仅传输自上次备份以来更改的数据块或正在使用的数据块。第三方应用程序可以访问此功能。通过调用 VADP,应用程序可请求VMkernel 返回自上次备份快照以来虚拟磁盘上已更改的数据块。 要使 CBT 识别自上次更改ID以来已更改的磁盘扇区,需要满足以下条件: 1. 主机必须是 ESX/ESXi 4.0 或更高版本。 2. 包含要进行磁盘跟踪的虚拟机的硬件版本必须是7或更高版本。 3. I/O 操作必须通过 ESX/ESXi 存储堆栈。因此,NFS 和虚拟兼容模式下的RDM 受支持,但物理兼容模式下的 RDM 不受支持。而对于VMFS、SAN、iSCSI 或本地磁盘都提供支持。 4. 必须为虚拟机启用 CBT。当备份日志中出现:更改块跟踪配置不正确 (Incorrect changed block tracking configuration)、磁盘“硬盘编号”的更改块跟踪配置不正确 (Disk "Hard disk #" has incorrect changed block tracking configuration)、一个或多个虚拟机磁盘的更改块跟踪配置不正确(One or more VM disks have incorrect changed block tracking configuration)时,此类虚拟机的CBT功能可能未开启。需按照[6]中所示开启。 5. 虚拟机存储不能是独立磁盘(持久性和非持久性的) 而在一些情况下,例如虚拟机启动时发生电源故障或硬关闭等情况,CBT 可能会重置和丢失增量变更的跟踪记录。在vSphere 4.1和之前的版本中,冷迁移(而不是Storage vMotion)会重置CBT,但不能禁用 CBT。在vSphere 5.5 Update 2 之前的 vSphere 5.x 版本中,Storage vMotion会重置CBT。如果出现此类情况,需要预先预留出足够时间窗口进行全备。 在实践中,发现有些ESXI版本会导致CBT功能失效。例如[7],CBT堆耗尽导致备份效率下降。此时在/var/log/vmkernel.log中显示 重删池: Vmware备份方案中一定要使用重删功能,可以通过Veeam、Vdp、NBU-MSDP软件实现或使用后端重删池例如NBU一体机、Avamar、Datadomain来实现。 使用重删设备能够:
以下为MSDP部署最佳做法,详细请参考[8] 1.逐渐增加作业数。 2.使用客户端重复数据删除来扩展重复数据删除处理以提高性能。 3.扩展备份介质服务器提高并发流,提高备份效率。 构建智能策略: 由于虚拟化平台中的虚拟机经常变更,因此配置智能策略自动发现,添加备份任务对于降低金融企业运维人员压力尤为重要。在金融企业中不同集群往往代表不同的业务区域。以下以NBU为例:说明一个自动发现策略: 在虚拟机备份策略中增加自动字段: Cluster anyof “1-管理区” AND NOT [backneed] equal “0” “1-管理区”代表集群名称,[backneed]代表VM中自定义字段,过滤不需要备份的虚拟机如:大量读写IO特性的vm(快照静默会使虚拟机夯住)。 通过这些条件的组合就能自动过滤,隔离备份虚拟机。 其他前置条件: 各备份软件对备份环境有各别特殊要求,例如NBU备份vmware前提条件(详细请参考[9]) 1.在计划备份的虚拟机上安装 VMware Tools。 2.在低版本NBU中Vm不能采用中文名命名 3.在Linux 虚拟机上,NetBackup 需要一个特殊的实用程序 (SYMCquiesce) 来静默文件系统,为创建快照做准备。如果没有SYMCquiesce,在创建快照时,NetBackup 无法保证该文件系统中的数据处于一致状态。 2.4 设备清单(可选) 除去vmware产品,备份项目中需采购的产品主要分为备份软件和后端重删存储两部分。具体设备根据选型方案所定。 2.5 关键设备选型(可扩展问题) 选型时候考虑以下几点 1. 备份效率 Vmware规模随着数据中心规模会迅猛增长,备份系统的并行能力尤为重要。因此要求备份软件支持多节点部署。 2. 管理效率 Vmware集群在上线后,变更频繁。高效的管理功能能大幅减轻运维人员压力。例如:本文之前提到的自动发现、报表等功能。 3. 恢复效率 大多数数据恢复并不需要完全恢复vm,直接通过NAS方式挂载出备份镜像,临时恢复出其中需要的文件能达到文件级别细粒度恢复,大幅度提升运维效率。 4. 其他新特性 备份产品处于在不断更新中总是能够提供更好的特性,综合考虑各家产品新特性,选出最适合自己的产品。 参考文档: [1] 《中国金融业信息化“十三五”发展 规 划(征求建议稿)》 [2] 《中国银行业信息科技“十三五”发展规划监管指导意见(征求意见稿)》 [3] 《金融行业云计算技术调查报告 》中国信息通信研究院2018年3月 [4] https://kb.vmware.com/s/article/2149614 [5] https://kb.vmware.com/s/article/2076678 [6] https://kb.vmware.com/s/article/2078214 [7] https://kb.vmware.com/s/article/2116126 [8] Symantec NetBackup™ Deduplication 指南 [9] Symantec NetBackup™ for VMware 管理指南 本文作者:沈志鑫,主要从事私有云、备份系统建设与运维支持工作。熟悉x86服务器、各类存储架构、VMWARE、NBU、BMC等平台的运维及管理。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |