怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略

怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略

怎么拿VMware日志(vm-support)我们就不赘述了,具体拿日志的步骤可以回看:https://vmlib.com/collect-vmware-esxi-log-bundle/

拿到了一份vm-support怎么去分析呢?

解压vm-support日志压缩包

我们拿到一份vm-support后,可以看到是一个.zip或者.tgz的压缩包。

这个压缩包采用了多重压缩打包,我们需要逐层解压。解压3次,直至看到类似下面的”主目录“:

vm-support日志包里面有什么?

vm-support里面一般有以下文件夹:

  • altbootbank
  • bootbank
  • commands
  • etc
  • json
  • lib64
  • usr
  • var
  • vmfs

大部分情况下,我们关注/commands和/var这两个文件夹就够了。

主要的日志在/var/run/log,如内核日志/var/run/log/vmkernel.log和主机日志/var/run/log/hostd.log

  • /bootbank – 活动分区的软链接,存放正在运行的 ESXi 路径下的内核模块及VIB(VMware安装包)
  • /altbootbank – 备用分区的软链接,新安装或升级的内容会先写入此分区,重启后切换为活动启动区;当主分区出现问题时可回滚使用。
  • /commands – 按命令名称(如 lsusb.txtesxcfg-info.txt)生成的纯文本输出文件,当你拿日志的时候(在命令行打vm-support时),ESXi就会运行一次这些脚本,然后保存输出,打包成vm-support.
  • /etc – 复制了主机的所有配置文件,包括网络配置、NTP、认证、Service配置等;例如ntp.mfx清单会复制 /etc/ntp.conf/etc/ntp.drift7
  • /json – 与 /commands/ 相同内容,但以 JSON 格式存储,方便脚本或自动化工具解析
  • /lib64 – 存放 ESXi 运行所需的 64 位共享库和内核模块,如PAM安全模块等;ESXi作为64位系统,会优先从 /lib64 加载模块
  • /usr – 包含大部分可执行文件、脚本和支持包工具,尤其是vm-support本身的脚本通常位于 /usr/lib/vmware/vm-support/
  • /var – 记录系统日志(/var/log/*)、核心转储(/var/core/*)及暂存数据,用于事后分析,如果曾经有过紫屏PSOD,会有紫屏日志放在var/core/vmkernel-zdump.*
  • /vmfs – ESXi上挂载所有VMFS数据存储的目录,通常在 /vmfs/volumes/ 下按UUID组织,包含虚拟机磁盘、配置文件等

我们来分4个方向去解析vm-support,来看看怎么在vm-support里找到我们所需要的信息

  • 虚拟机VM
  • ESXi主机
  • 网络
  • 存储

怎么在vm-support里看VM虚拟机方面的问题

虚拟机的日志路径:\vmfs\volumes\datastore uuid\vm name\vmware.log

每一个虚拟机有自己独立的路径

细分类型日志路径搜索关键字解释
VM数量\etc\vmware\hostd\vmInventory.xml所有在该ESXi上开着机的VM列表
看VM配置\vmfs\volumes\\\.vmxnumvcpus该虚拟机vCPU数量
memSize内存大小
guestOS看该VM装了什么系统
VM开机/关机时间原因\vmfs\volumes\\\vmware.logCPU reset: softGuest OS initiated reset (OS里面按的)
详细见https://vmlib.com/check-vm-shutdown-reboot-reasons/PM Soft OffGuest OS initiated shutdown  (OS里面按的)
CPU reset: hardvSphere API call to restart (外面按的)
MKS local poweroffvSphere API call to poweroff (外面按的,作用类似拔电源)
Tools: sending ‘OS_Halt’ (state = 1)vSphere API call to shutdown (外面按的)
PM Soft Off. Good-bye.vSphere API call to shutdown (外面按的)
vMotion问题\vmfs\volumes\\\vmware.logmid id找migration id, 搜’mid id’
上面找到的mid idvmware.log搜mid id,可以看source和destination
\var\run\log\hostd.log上面找到的mid idhostd.log搜mid id,可以看vmotion过程

怎么在vm-support看ESXi主机方面的信息

日志路径搜索关键字解释
\commands\date.txt拿vm-support的时间
.\commands\esxcfg-info_-a.txt.FRAG-00000Product Name看服务器型号
Vendor Name看服务器厂商
Serial Number看服务器序列号
.\commands\python_usrlibvmwarevm-supportbinsystemStorageDebugpyc.txtHostname看ESXi主机名字
\commands\localcli_software-profile-get.txt看升级/打补丁记录
\commands\localcli_software-vib-list.txt看ESXi装了的VIB软件包列表
\commands\esxcfg-module_-q.txt看module模块,如看下migrate module是否有启用
\var\run\log\vmksummary.log看该ESXi的uptime, 和VMs数量

怎么在vm-support里诊断网络问题

细分类型日志路径搜索关键字解释
看配置\commands\nicinfo.sh.txtvmnic看有多少个物理网口,如vmnic0,1,2,3
Firmware Version看网卡的固件版本
Driver Info看网卡所使用的驱动名称,如qfle3
\commands\localcli_software-vib-list.txtqfle3看网卡的驱动版本
\commands\esxcfg-vmknic_-l.txt看vmkernel port信息,如ESXi管理IP地址, vMotion IP地址, MTU
\commands\esxcfg-vswitch_-l.txt看vswitch信息,如
看日志
\var\run\log\vobd.log
linkstate is看物理网口up/down记录
\var\run\log\vmkernel.log在相应时间节点在vm内核日志看下有没网络相关的错误

怎么在vm-support里看存储相关的问题

细分类型日志路径搜索关键字解释
看存储配置\commands\localcli_storage-core-adapter-list.txt看HBA
\commands\localcli_storage-san-sas-list.txt看SAS HBA的固件版本和驱动名字,如smartpqi
\commands\localcli_software-vib-list.txt上面找到的smartpqi看SAS HBA的驱动版本
\commands\localcli_storage-san-fc-list.txt看FC SAN HBA的固件版本和驱动名字,如qedf
\commands\localcli_software-vib-list.txt上面找到的qedf看SAN HBA的驱动版本
\commands\df.txt看Datastore的空间%
\commands\localcli_storage-filesystem-list–i.txt看Datastore的UUID, 挂载点Mount Point的UUID
\commands\esxcfg-scsidevs_-m.txt看Datastore和硬件的映射关系(找datastore底层device的naa.id)
\commands\localcli_storage-core-device-list.txt上面找到的naa.600508b1001c52ce4cb1772dddedbd62搜naa.id,看该设备的参数,如vendor, RAID level, 是否ssd, 是否offline, 是否支持VAAI,RDM等
\commands\esxcfg-mpath_-b.txt看SAN的multipath多路径配置
看存储相关的日志\var\run\log\vmkernel.logScsiDeviceIOhttps://knowledge.broadcom.com/external/article?legacyId=289902
CmdSN
All Paths Down state
0x28https://www.t10.org/lists/2status.htm
TimedOut存储心跳超时
\var\run\log\vmkwarning.logperformance has deteriorated存储性能下降
\var\run\log\hostd.logLost access to volume存储卷断开
Successfully restored access to volume存储卷恢复
\var\run\log\vobd.logesx.problem.vmfs.heartbeat.timedout存储心跳超时
esx.problem.vmfs.heartbeat.recovered存储心跳恢复
connection failure存储网络连接失败

有VM问题需要协助?

免费试用VMware技术助理(已接Deepseek)!即时解答VM难题

→ 🤖VM技术助理

解析和诊断各类vCenter错误,ESXi日志,虚拟机vmware.log

→ 📕VMware日志分析器

图书推介 - 京东自营

24小时热门

还有更多VMware问题?

免费试下我们的VMware技术助理(已接Deepseek)!即时解答VM难题 → 🤖VM技术助理

试试 📕VMware日志分析器 免费诊断各类vCenter错误,ESXi日志,虚拟机vmware.log等等

########

扫码加入VM资源共享交流微信群(请备注加群

需要协助?或者只是想技术交流一下,直接联系我们!

推荐更多

ESXi 8.x中磁盘合并失败:IO被VMFS通过virt-reset中止问题分析
运维必备

ESXi 8.x中磁盘合并失败:IO被VMFS通过virt-reset中止问题分析

ESXi 8.x中磁盘合并失败:IO被VMFS通过virt-reset中止问题分析。在ESXi 8.x环境中,磁盘合并操作失败并显示\”IO was aborted by VMFS via a virt-reset\”错误?本文详细分析了这个由光纤通道拥塞导致的常见故障,并提供了完整的解决方案。 本文针对该问题提供了深度剖析与实测解决方案。

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题
运维必备

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题

添加旧版本 ESXi 主机到 vCenter 8.x 失败的证书指纹验证超时问题。详细解析在 vCenter 8.x 中添加旧版本 ESXi 主机失败的问题,重点说明证书指纹验证超时的原因,提供使用 PowerCLI 强制添加的解决方法,帮助管理员快速完成主机添加操作。 本文针对该问题提供了深度剖析与实测解决方案。

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题
运维必备

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题

大内存虚拟机在 vMotion 期间内存传输导致的无响应问题。详细解析大内存虚拟机在 vMotion 期间内存传输过程中出现的无响应问题,重点说明精细内存跟踪缓冲器溢出的原因,提供目前的解决方案和未来版本的改进,帮助管理员优化虚拟机迁移过程。 本文针对该问题提供了深度剖析与实测解决方案。

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录
运维必备

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录

vapi-endpoint 服务启动失败导致 vCenter Web Client 无法登录。详细解析 vCenter Web Client 无法登录的问题,重点说明 vapi-endpoint 服务因解决方案用户证书无效导致的启动失败,提供完整的 vSphere Certificate Manager 操作步骤,帮助管理员快速恢复登录功能。 本文针对该问题提供了深度剖析与实测解决方案。

//omg10.com/4/9119499