虚拟机快照或备份失败”Failed to quiesce the virtual machine”

虚拟机快照或备份失败"Failed to quiesce the virtual machine"

问题现象,vCenter的事件日志或者快照任务失败时会出现以下两种错误:

1. An error occurred while saving the snapshot: Failed to quiesce the virtual machine

2. ’VssSyncStart‘ operation failed

在虚拟机进行”应用一致快照Application consistent“的快照操作,或者通过第三方备份软件如Veeam做增量备份是,vCenter会提醒创建静默快照失败,并会出现以上错误,中文翻译类似为:“无法创建静默快照,因为快照操作超出了冻结虚拟机中挂起I/O的时间限制”。

具体表现为,在VMware的vpxa.log文件中,我们可以看到类似以下的错误记录:

2023-10-25T06:43:56.192Z infovpxa[2099879] [Originator@6876 sub=DefaultopID=l9hyxltb-10461-auto-82m-h5:70003800-2-01-24] [VpxLRO] -- ERROR task-4480-- vpxa -- vpxapi.VpxaService.createSnapshot:vim.fault.ApplicationQuiesceFault:
--> Result:
-->(vim.fault.ApplicationQuiesceFault) {
-->   faultCause = (vmodl.MethodFault) null,
-->   faultMessage = (vmodl.LocalizableMessage) [
-->      (vmodl.LocalizableMessage) {
-->         key = "msg.checkpoint.save.fail2.std3",
-->         arg = (vmodl.KeyAnyValue) [
-->            (vmodl.KeyAnyValue) {
-->               key = "1",
-->               value = "msg.snapshot.error-QUIESCINGERROR"
-->            }
-->         ],
-->         message = "An error occurredwhile saving the snapshot: Failed to quiesce the virtual machine."
-->      },
-->      (vmodl.LocalizableMessage) {
-->         key = "msg.snapshot.vigor.take.error",
-->         arg = (vmodl.KeyAnyValue) [
-->            (vmodl.KeyAnyValue) {
-->               key = "1",
-->               value = "msg.snapshot.error-QUIESCINGERROR"
-->            }
-->         ],
-->         message = "An error occurred while taking a snapshot: Failed to quiesce the virtual machine."
-->      }
-->    ]
-->    msg ="An error occurred while quiescing the virtual machine. See the virtualmachine's event log for details."
--> }

虚拟机的vmware.log日志会有这样的错误:

2023-10-25T06:43:54.129ZIn(05) vmx - Msg_Post: Warning
2023-10-25T06:43:54.129ZIn(05) vmx - [msg.snapshot.quiesce.vmerr] The guest OS has reported an errorduring quiescing.
2023-10-25T06:43:54.129ZIn(05)+ vmx - The error code was: 5
2023-10-25T06:43:54.129ZIn(05)+ vmx - The error message was: 'VssSyncStart'operation failed: IDispatch error #8449 (0x80042301)
2023-10-25T06:45:21.631ZIn(05) vmx - Msg_Post: Warning
2023-10-25T06:45:21.631ZIn(05) vmx - [msg.snapshot.quiesce.vmerr] The guest OS has reported an errorduring quiescing.
2023-10-25T06:45:21.631ZIn(05)+ vmx - The error code was: 5
2023-10-25T06:45:21.631ZIn(05)+ vmx - The error message was: 'VssSyncStart'operation failed: IDispatch error #8449 (0x80042301)
2023-10-25T06:59:13.800ZIn(05) vmx - Msg_Post: Warning
2023-10-25T06:59:13.800ZIn(05) vmx - [msg.snapshot.quiesce.vmerr] The guest OS has reported an errorduring quiescing.
2023-10-25T06:59:13.800Z In(05)+vmx - The error code was: 5
2023-10-25T06:59:13.800ZIn(05)+ vmx - The error message was: 'VssSyncStart'operation failed: IDispatch error #8449 (0x80042301)

原因和解决办法

这个问题发生在虚拟机的读写IO输入输出量很高时,静默操作quiesce无法将所有数据刷新到磁盘上,同时VM还在生成更多的IO,这个情况出现时,vCenter就会有上述错误,具体表象就是无法备份或者做快照。

此外,如果在一个没有可用空间的虚拟机上创建一个静默快照,也会发生这个问题。

解决这个问题,可以采取以下几种方法:

  • 核实 VSS、客户端和备份软件方面的配置。
  • 重新考虑一下备份/快照是否真的需要应用一致快照Application consistent?
  • 减少对虚拟机的持续读写IO。可以通过一些系统里面的脚本,来减少应用的IO输入输出。
  • 换一成”崩溃一致快照Crash Consistent“(”应用一致快照Application consistent”的相反),避免文件系统的静默,如下图,不要勾选quiesce guest file system

总结来说,虚拟机快照失败或备份失败可能由多种原因导致,包括高I/O负载、存储空间不足、备份软件兼容性问题等。如果遇到“Failed to quiesce the virtual machine”或“VssSyncStart operation failed”等错误提示,建议依次检查虚拟机的磁盘空间、备份配置以及操作系统的VSS服务状态。为确保虚拟机快照成功,优化虚拟机的I/O性能并定期清理过多的旧快照,能够有效减少快照失败的情况。此外,使用Crash Consistent快照作为备选方案也是解决快照无法静默的问题之一。希望本篇指南能够帮助用户更好地应对虚拟机快照和备份失败的问题,确保vSphere环境的高效运行。

有VM问题需要协助?

免费试用VMware技术助理(已接Deepseek)!即时解答VM难题

→ 🤖VM技术助理

解析和诊断各类vCenter错误,ESXi日志,虚拟机vmware.log

→ 📕VMware日志分析器

图书推介 - 京东自营

24小时热门

还有更多VMware问题?

免费试下我们的VMware技术助理(已接Deepseek)!即时解答VM难题 → 🤖VM技术助理

试试 📕VMware日志分析器 免费诊断各类vCenter错误,ESXi日志,虚拟机vmware.log等等

########

扫码加入VM资源共享交流微信群(请备注加群

需要协助?或者只是想技术交流一下,直接联系我们!

推荐更多

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题
运维必备

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题。详细解析在 vCenter 8.x 中添加旧版本 ESXi 主机失败的问题,重点说明证书指纹验证超时的原因,提供使用 PowerCLI 强制添加的解决方法,帮助管理员快速完成主机添加操作。 本文针对该问题提供了深度剖析与实测解决方案。

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题
运维必备

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题。详细解析大内存虚拟机在 vMotion 期间内存传输过程中出现的无响应问题,重点说明精细内存跟踪缓冲器溢出的原因,提供目前的解决方案和未来版本的改进,帮助管理员优化虚拟机迁移过程。 本文针对该问题提供了深度剖析与实测解决方案。

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录
运维必备

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录。详细解析 vCenter Web Client 无法登录的问题,重点说明 vapi-endpoint 服务因解决方案用户证书无效导致的启动失败,提供完整的 vSphere Certificate Manager 操作步骤,帮助管理员快速恢复登录功能。 本文针对该问题提供了深度剖析与实测解决方案。

vCenter Server 虚拟机的快照最佳实践
运维必备

vCenter Server 虚拟机的快照最佳实践

vCenter Server 虚拟机的快照最佳实践。详细解析 vCenter Server 虚拟机的快照最佳实践,重点说明 vCenter HA、增强型链接模式 (ELM) 和独立 vCenter 的不同快照策略,帮助管理员避免复制和恢复问题。 本文针对该问题提供了深度剖析与实测解决方案。

//omg10.com/4/9119499