vCenter Server Appliance 6.7 部署在 firstboot 期间失败

vCenter Server Appliance 6.7 部署在 firstboot 期间失败

问题描述

在部署、迁移或升级到 vCenter Server Appliance 6.7 时,你极大可能会遇到以下问题:

  • 部署过程在 firstboot 阶段失败
  • 失败步骤显示为 “updatemgr-firstboot”
  • 错误信息显示为 “Failed to register updatemgr extension”
  • 日志中显示意外的时间差异

故障现象与日志分析

关键日志位置

vCenter Server Appliance – firstboot 日志位于 /var/log/firstboot 目录中。

故障日志内容

1. firstbootStatus.json

"failedSteps": "updatemgr-firstboot"

2. updatemgr-firstboot.py_6012_stderr.log

Failed to register updatemgr extension

3. fbInstall.json
显示意外的时间差异:

"start_time": "2018-05-07T13:00:00.000Z",
   "end_time": "2018-05-07T18:00:00.000Z"

或者

"start_time": "2018-05-07T18:05:00.000Z",
   "end_time": "2018-05-07T18:00:00.000Z"

根本原因分析

问题的根本原因是 vSphere 环境中的时间不一致。最常见的情况是:

1. 目标 ESXi 主机与 NTP 同步不正确
2. 如果目标 ESXi 主机属于完全自动化的 DRS 集群,虚拟机可能会迁移到具有不同时间的主机上
3. 源和目标 ESXi 主机之间的时间差异
4. 外部 Platform Services Controller 的时间差异

解决方案

1. 确保 ESXi 主机与 NTP 同步

#### 检查 ESXi 主机的时间同步状态

1. 使用 SSH 登录到目标 ESXi 主机
2. 检查 NTP 配置:

esxcli system ntp server list

3. 检查 NTP 同步状态:

esxcli system time get

#### 配置 NTP

1. 如果 NTP 未配置或不正确,执行以下命令:

# 停止 NTP 服务(如果正在运行)
   /etc/init.d/ntpd stop

 

   # 配置 NTP 服务器
   esxcli system ntp server set -s 
   esxcli system ntp server set -s

 

   # 启用 NTP 服务
   esxcli system ntp set --enabled true

 

   # 启动 NTP 服务
   /etc/init.d/ntpd start

2. 检查 NTP 同步状态:

ntpq -p

2. 调整 DRS 自动化级别

如果目标 ESXi 主机属于完全自动化的 DRS 集群:

1. 在 vSphere Client 中,导航到目标集群
2. 右键点击集群,选择 编辑设置
3. 在左侧菜单中选择 vSphere DRS
4. 将 自动化级别 更改为 手动
5. 点击 确定 保存更改

3. 验证所有相关组件的时间同步

确保以下组件的时间同步正确:
1. 源 vCenter Server Appliance
2. 目标 ESXi 主机
3. 源 ESXi 主机(如果正在进行迁移)
4. 外部 Platform Services Controller(如果使用)

4. 重新部署 vCenter Server Appliance

完成以上调整后,重新尝试部署:

1. 删除之前失败的 vCenter Server Appliance
2. 使用相同的配置重新部署
3. 确保部署过程顺利完成

预防措施

为了避免将来遇到类似问题,建议:

1. 确保 NTP 配置正确:在所有 ESXi 主机和 vCenter 服务器上正确配置 NTP
2. 定期检查时间同步:定期验证时间同步状态,防止时间漂移
3. 使用手动 DRS 级别进行部署:在部署 vCenter Server Appliance 期间,使用手动 DRS 自动化级别
4. 时间监控:设置监控以跟踪 ESXi 主机和 vCenter 服务器之间的时间差异

验证与测试

验证时间同步

# 在 vCenter Server Appliance 上检查 NTP 同步
timedatectl status

 

# 在 ESXi 主机上检查 NTP 同步
ntpq -p

验证部署过程

重新部署后,监控部署过程并检查以下内容:
1. 部署过程顺利进行到完成
2. firstboot 阶段成功完成
3. 更新管理器扩展成功注册

相关资源

1. [VMware KB 338259](https://knowledge.broadcom.com/external/article?articleNumber=338259)
2. [Synchronizing Clocks on the vSphere Network](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vcenterhost.doc/GUID-3B87233F-7786-453E-A415-DD651F0797A4.html)
3. [Edit Cluster Settings](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.resmgmt.doc/GUID-076850B4-0E5E-4313-A4B4-33C7A72A5CD2.html)
4. [System Requirements for the New vCenter Server Appliance](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vcenterhost.doc/GUID-3B87233F-7786-453E-A415-DD651F0797A4.html)

通过按照本文中的步骤进行操作,您可以解决 vCenter Server Appliance 6.7 部署在 firstboot 期间失败的问题。


Reference: VMware KB 338259

有VM问题需要协助?

免费试用VMware技术助理(已接Deepseek)!即时解答VM难题

→ 🤖VM技术助理

解析和诊断各类vCenter错误,ESXi日志,虚拟机vmware.log

→ 📕VMware日志分析器

图书推介 - 京东自营

24小时热门

还有更多VMware问题?

免费试下我们的VMware技术助理(已接Deepseek)!即时解答VM难题 → 🤖VM技术助理

试试 📕VMware日志分析器 免费诊断各类vCenter错误,ESXi日志,虚拟机vmware.log等等

########

扫码加入VM资源共享交流微信群(请备注加群

需要协助?或者只是想技术交流一下,直接联系我们!

推荐更多

ESXi 7.x/8.x hostd 间歇性无响应事件分析
运维必备

ESXi 7.x/8.x hostd 间歇性无响应事件分析

ESXi 7.x/8.x hostd 间歇性无响应事件分析。详细解析 ESXi 7.x/8.x 中 ‘hostd detected to be non-responsive’ 间歇性事件的原因、现象和解决方法,帮助管理员正确处理这种时序性问题。 本文针对该问题提供了深度剖析与实测解决方案。

vCenter Server 服务堆内存配置显示差异原因分析

vCenter Server 服务堆内存配置显示差异原因分析。解析 vCenter Server 中使用 cloudvm-ram-size 命令配置服务堆内存时,显示值与实际设置值不符的原因,帮助管理员正确理解 CompressClassSize 的作用。 本文针对该问题提供了深度剖析与实测解决方案。

ESXi 7.x/8.x/9.x 远程 Syslog 配置避坑指南
运维必备

ESXi 7.x/8.x/9.x 远程 Syslog 配置避坑指南

ESXi 7.x/8.x/9.x 远程 Syslog 配置避坑指南。这篇文章详细介绍了 ESXi 7.x/8.x/9.x 版本中配置远程 Syslog 的完整步骤,包括命令行配置、主机配置文件、高级配置选项,以及防火墙设置的注意事项,帮助管理员避免常见的配置陷阱。 本文针对该问题提供了深度剖析与实测解决方案。

vCenter Server Appliance 6.7 部署在 firstboot 期间失败
运维必备

vCenter Server Appliance 6.7 部署在 firstboot 期间失败

vCenter Server Appliance 6.7 部署在 firstboot 期间失败。vCenter Server Appliance 6.7 部署在 firstboot 期间失败,提示更新管理器扩展注册失败?本文介绍根本原因和完整的解决方法。 本文针对该问题提供了深度剖析与实测解决方案。

//omg10.com/4/9119499