问题简介
当在同一个SSO域中使用多个VCSA并在 Enhanced Linked Mode (ELM) 下进行复制时,如果在VCSA处于运行状态时进行快照,域极有可能会被损坏。说白了,就是不要边开着机器边拍快照,万一出错就比较麻烦了。强烈推荐在ELM部署中使用离线快照作为安全的回滚点。也就是说,所有的VCSA都应当以正常方式先关机,然后在关机状态下(且最好同时操作)再拍快照。
如果必须回退到某项更改,务必将ELM部署中所有节点都恢复到这一离线/一致的快照状态。只有在所有节点都从快照中还原之后,才可以开始逐个开机。
(注意:别想着只恢复部分节点,否则会留下隐患)
否则,各节点上嵌入式 PSC Platform Service Controllers的本地 VM Directory实例之间就可能出现不一致,进而导致各节点无法顺利完成复制。
另外一个备选方案是使用基于文件的VCSA备份。
环境
- VMware vCenter Server Appliance 6.x
- VMware vCenter Server Appliance 7.0.x
- VMware vCenter Server Appliance 8.0.x
原因
使用ELM的vCenter服务器每30秒就会相互复制它们的vmdir数据库更改。
如果在未关闭电源的情况下拍摄快照,即使进行了quiesce静默操作,也会处于一种不确定的复制状态。
更糟的是,如果仅仅还原其中一个vCenter节点而其他的保持原状,它们可能会以不同的同步状态恢复,结果就得费劲手动去同步vmdir数据库,有时甚至可能引发无法修复的问题。
解决方案
正如上文所述,VMware建议在进行任何会对vCenter Server产生变更的操作之前,务必对同一 SSO 域内(即处于ELM复制状态)的所有节点进行离线快照(虚拟机处于关机状态)。
对于任何SSO域更新操作,都必须对SSO域内所有节点(ELM 环境)执行离线快照。这些操作包括但不限于:
- vCenter Server更新(无论是完整版本、更新版本还是补丁版本)。
- 使用lsdoctor工具进行任何变更。
- 向现有SSO域中添加新的vCenter Server。
- 从现有SSO域中退役一个vCenter Server。
- 证书更换(例如 Machine、CA、STS 等)。
相反,任何只读操作则不需要离线快照。也就是说,下列操作都可以在不拍快照的情况下进行(无论是在线还是离线快照都不需要):
- vCenter Server / PSC 的备份。
- 使用 lsdoctor 工具时带上 –lscheck 参数。
- 运行 checksts 脚本。
注意事项:
如果 vCenter 虚拟机属于 vCenter High Availability (VCHA) 配置的一部分,则千万不要对它们进行快照。
除非仅使用 –lscheck (后面不加参数,只用于检查 lookup service 中的常见问题而不作修改),否则在使用 lsdoctor工具时,离线快照是必须的。
在为vCenter Server或PSC拍快照前,请确保没有正在运行的备份任务。
参考官方KB https://knowledge.broadcom.com/external/article/313886/vmware-vcenter-in-enhanced-linked-mode-p.html
