在vCenter Server的增强链接模式(Enhanced Linked Mode,ELM)环境中,替换过期的SSL证书是一项常见的维护任务。但如果操作不当,您可能会遇到一个严重的问题:vCenter Server Appliance (VCSA)的网络接口利用率会突然飙升到100%并保持饱和状态,导致vCenter Server响应缓慢或无法响应。
其实呢,这个问题的根源在于证书替换过程中可能会导致Lookup Service中出现重复的服务端点。当在ELM环境中替换证书时,旧的服务注册可能没有被正确删除。这些重复端点的存在会迫使vCenter目录服务(vmdir)和vCenter Server服务(vpxd)进入持续的复制和同步循环,因为它们试图调和冲突的注册。这种快速的通信会淹没网络接口,导致资源饱和。
直接开干,解决这个问题的方法是使用lsdoctor工具识别并删除重复的服务端点。以下是具体步骤:
步骤1:下载并安装lsdoctor工具
首先,您需要下载lsdoctor工具并将其传输到受影响的vCenter Server Appliance上。您可以按照VMware官方文档中关于”Using the ‘lsdoctor’ Tool”的说明进行操作。
下载地址:https://knowledge.broadcom.com/external/article?articleNumber=429253
步骤2:运行lsdoctor工具进行诊断
一旦工具安装完成,您需要运行lsdoctor工具来诊断问题。lsdoctor会扫描Lookup Service并识别重复的服务端点。
运行lsdoctor的基本命令格式如下:
java -jar lsdoctor.jar
lsdoctor工具会生成详细的报告,帮助您识别问题所在。
步骤3:识别重复服务端点
如果lsdoctor工具的输出类似于以下消息,则说明确实存在重复的服务端点:
YYYY-MM-DDTHH:MM:SS ERROR generateReport: \ (VC 7.0 or CGW) found Duplicates Found: Ignore if this is the PSC HA VIP. Otherwise, you must unregister the extra endpoints.
步骤4:清除重复服务端点
根据lsdoctor工具的输出,您需要按照”vCenter has duplicate endpoints”文档中的说明来清除重复的服务端点。
这通常涉及使用vmdir工具或vCenter Server API来注销额外的服务端点。具体操作取决于您的vCenter Server版本和配置。
验证解决方案
在完成重复服务端点的清除后,您需要验证问题是否已解决:
1. 监控vCenter Server Appliance的网络接口利用率
2. 检查vCenter Server的响应时间
3. 验证vCenter Server之间的通信是否正常
预防措施
为了防止未来再次出现类似问题,您可以采取以下预防措施:
1. 在替换SSL证书前,确保备份vCenter Server和PSC的数据
2. 严格按照VMware官方文档的步骤进行证书替换
3. 替换证书后,及时检查和清理旧的服务注册
4. 定期监控vCenter Server的网络和系统资源利用率
重要注意事项
- PSC HA VIP:如果lsdoctor工具提示忽略PSC HA VIP,那是正常的,因为PSC HA VIP是高可用性配置的一部分
- 网络隔离:在增强链接模式下,vCenter Server之间的网络通信是关键,任何网络问题都可能导致复制和同步失败
- 工具兼容性:确保使用与您的vCenter Server版本兼容的lsdoctor工具版本
通过遵循这些步骤,您应该能够成功解决在增强链接模式下替换SSL证书后vCenter Server Appliance网络利用率过高的问题。需要注意的是,这个问题的解决可能需要对vCenter Server的内部组件有一定了解,因此建议在生产环境中操作前先在测试环境中进行验证。







