问题现象:主机Not Responding,VM无法删除、Disconnect灰色不可点
在日常维护 VMware vCenter Server 与 VMware ESXi 集群时,如果某台 ESXi 因为硬件故障、断电、管理网中断或整机宕机,vCenter 往往会把该主机标记为 Not Responding。这时问题就不只是“主机离线”这么简单,随之而来的一系列管理异常更让人头疼:虚拟机显示 Inaccessible 或 Orphaned、无法开关机、无法迁移,Host 的 Disconnect 按钮变灰,Remove from Inventory 也点不了,甚至通过 iLO/iDRAC/带外管理都无法恢复控制。
更诡异的是,很多 VM 明明已经实际关机,但在 vCenter 里仍然显示 Powered On,导致既不能删除也不能重新注册,像是被“锁死”在库存里。无论是重连、刷新、重新登录,UI 都没有变化。这种场景在生产环境里很常见,尤其是物理服务器突然损坏、网卡故障或整机失联后,经常会遗留一堆“幽灵虚拟机”,既影响运维操作,也干扰 HA/DRS/迁移计划。

根本原因:vCenter与主机管理代理握手失败,库存被数据库锁定
从原理上看,这并不是权限或界面 Bug,而是 vCenter 的保护机制。
当主机失联时,vCenter 内部的 vpxd 服务无法与 ESXi 端的管理代理(vpxa)完成 Disconnect 握手,因此系统无法确认虚拟机真实状态。为了防止出现数据损坏、重复注册或 split-brain(脑裂)风险,vCenter 会主动锁定这些 VM 的库存对象,不允许执行删除、移除或生命周期操作。
简单理解就是:只要 Host 没有被正常 Disconnect,VM 就不允许被清理。
但问题在于,当主机已经彻底损坏或永远无法恢复时,这个“安全机制”反而变成了运维阻碍,于是就出现:
- ESXi Not Responding 无法断开
- Disconnect 灰色
- Remove from Inventory 失败或超时
- VM 显示 Orphaned / Inaccessible
- 无法重新注册虚拟机
这些都是 vCenter 数据库存锁导致的典型表现。
官方解决方法:强制移除Host + 重启vCenter服务
如果确认主机已经永久故障、无法上线(例如主板损坏、硬盘报废或已退役),正确做法不是反复重试连接,而是 直接强制从 Inventory 清理 Host。
在 vSphere Client 中:
右键点Not Responding 主机 → Remove from Inventory → Yes 确认
这个操作会跳过 Disconnect 的步骤,直接把这个ESXi Host 和其关联 VM 从 vCenter 数据库中清除,相当于“强制解绑”。大多数情况下,执行后 Inaccessible/Orphaned VM 会立即消失。
如果界面卡住或任务一直 Pending,可以 SSH 登录 VCSA,重启 vCenter 核心服务:
service-control --restart vmware-vpxd
重启后会话刷新,残留锁基本都会释放,这一步在大规模环境中尤其有效。

恢复虚拟机:从共享存储重新 Register VM
主机被移除后,如果虚拟机磁盘仍在共享存储(vSAN / NFS / iSCSI / FC Datastore),数据其实完全没有丢,只是“脱离管理”。此时只需手动重新注册即可恢复。
操作路径:
Storage → Datastore → Browse Files → 找到 VM 文件夹 → 右键 .vmx → Register VM
几分钟内即可重新出现在清单中,直接开机运行。
因此遇到 ESXi Not Responding 无法删除虚拟机、Orphaned VM 清理失败、vCenter Disconnect 灰色不可点、Host 无法移除 等问题时,可以优先采用“强制 Remove Host + 重新注册 VM”的思路,这是生产环境里最稳妥、也是成功率最高的处理方式。






