问题描述
在部署、迁移或升级到 vCenter Server Appliance 6.7 时,你极大可能会遇到以下问题:
- 部署过程在 firstboot 阶段失败
- 失败步骤显示为 “updatemgr-firstboot”
- 错误信息显示为 “Failed to register updatemgr extension”
- 日志中显示意外的时间差异
故障现象与日志分析
关键日志位置
vCenter Server Appliance – firstboot 日志位于 /var/log/firstboot 目录中。
故障日志内容
1. firstbootStatus.json:
"failedSteps": "updatemgr-firstboot"
2. updatemgr-firstboot.py_6012_stderr.log:
Failed to register updatemgr extension
3. fbInstall.json:
显示意外的时间差异:
"start_time": "2018-05-07T13:00:00.000Z",
"end_time": "2018-05-07T18:00:00.000Z"
或者
"start_time": "2018-05-07T18:05:00.000Z",
"end_time": "2018-05-07T18:00:00.000Z"
根本原因分析
问题的根本原因是 vSphere 环境中的时间不一致。最常见的情况是:
1. 目标 ESXi 主机与 NTP 同步不正确
2. 如果目标 ESXi 主机属于完全自动化的 DRS 集群,虚拟机可能会迁移到具有不同时间的主机上
3. 源和目标 ESXi 主机之间的时间差异
4. 外部 Platform Services Controller 的时间差异
解决方案
1. 确保 ESXi 主机与 NTP 同步
#### 检查 ESXi 主机的时间同步状态
1. 使用 SSH 登录到目标 ESXi 主机
2. 检查 NTP 配置:
esxcli system ntp server list
3. 检查 NTP 同步状态:
esxcli system time get
#### 配置 NTP
1. 如果 NTP 未配置或不正确,执行以下命令:
# 停止 NTP 服务(如果正在运行)
/etc/init.d/ntpd stop
# 配置 NTP 服务器
esxcli system ntp server set -s
esxcli system ntp server set -s
# 启用 NTP 服务
esxcli system ntp set --enabled true
# 启动 NTP 服务
/etc/init.d/ntpd start
2. 检查 NTP 同步状态:
ntpq -p
2. 调整 DRS 自动化级别
如果目标 ESXi 主机属于完全自动化的 DRS 集群:
1. 在 vSphere Client 中,导航到目标集群
2. 右键点击集群,选择 编辑设置
3. 在左侧菜单中选择 vSphere DRS
4. 将 自动化级别 更改为 手动
5. 点击 确定 保存更改
3. 验证所有相关组件的时间同步
确保以下组件的时间同步正确:
1. 源 vCenter Server Appliance
2. 目标 ESXi 主机
3. 源 ESXi 主机(如果正在进行迁移)
4. 外部 Platform Services Controller(如果使用)
4. 重新部署 vCenter Server Appliance
完成以上调整后,重新尝试部署:
1. 删除之前失败的 vCenter Server Appliance
2. 使用相同的配置重新部署
3. 确保部署过程顺利完成
预防措施
为了避免将来遇到类似问题,建议:
1. 确保 NTP 配置正确:在所有 ESXi 主机和 vCenter 服务器上正确配置 NTP
2. 定期检查时间同步:定期验证时间同步状态,防止时间漂移
3. 使用手动 DRS 级别进行部署:在部署 vCenter Server Appliance 期间,使用手动 DRS 自动化级别
4. 时间监控:设置监控以跟踪 ESXi 主机和 vCenter 服务器之间的时间差异
验证与测试
验证时间同步
# 在 vCenter Server Appliance 上检查 NTP 同步
timedatectl status
# 在 ESXi 主机上检查 NTP 同步
ntpq -p
验证部署过程
重新部署后,监控部署过程并检查以下内容:
1. 部署过程顺利进行到完成
2. firstboot 阶段成功完成
3. 更新管理器扩展成功注册
相关资源
1. [VMware KB 338259](https://knowledge.broadcom.com/external/article?articleNumber=338259)
2. [Synchronizing Clocks on the vSphere Network](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vcenterhost.doc/GUID-3B87233F-7786-453E-A415-DD651F0797A4.html)
3. [Edit Cluster Settings](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.resmgmt.doc/GUID-076850B4-0E5E-4313-A4B4-33C7A72A5CD2.html)
4. [System Requirements for the New vCenter Server Appliance](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vcenterhost.doc/GUID-3B87233F-7786-453E-A415-DD651F0797A4.html)
通过按照本文中的步骤进行操作,您可以解决 vCenter Server Appliance 6.7 部署在 firstboot 期间失败的问题。
Reference: VMware KB 338259





