怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略

怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略

怎么拿VMware日志(vm-support)我们就不赘述了,具体拿日志的步骤可以回看:https://vmlib.com/collect-vmware-esxi-log-bundle/

拿到了一份vm-support怎么去分析呢?

解压vm-support日志压缩包

我们拿到一份vm-support后,可以看到是一个.zip或者.tgz的压缩包。

这个压缩包采用了多重压缩打包,我们需要逐层解压。解压3次,直至看到类似下面的”主目录“:

vm-support日志包里面有什么?

vm-support里面一般有以下文件夹:

  • altbootbank
  • bootbank
  • commands
  • etc
  • json
  • lib64
  • usr
  • var
  • vmfs

大部分情况下,我们关注/commands和/var这两个文件夹就够了。

主要的日志在/var/run/log,如内核日志/var/run/log/vmkernel.log和主机日志/var/run/log/hostd.log

  • /bootbank – 活动分区的软链接,存放正在运行的 ESXi 路径下的内核模块及VIB(VMware安装包)
  • /altbootbank – 备用分区的软链接,新安装或升级的内容会先写入此分区,重启后切换为活动启动区;当主分区出现问题时可回滚使用。
  • /commands – 按命令名称(如 lsusb.txtesxcfg-info.txt)生成的纯文本输出文件,当你拿日志的时候(在命令行打vm-support时),ESXi就会运行一次这些脚本,然后保存输出,打包成vm-support.
  • /etc – 复制了主机的所有配置文件,包括网络配置、NTP、认证、Service配置等;例如ntp.mfx清单会复制 /etc/ntp.conf/etc/ntp.drift7
  • /json – 与 /commands/ 相同内容,但以 JSON 格式存储,方便脚本或自动化工具解析
  • /lib64 – 存放 ESXi 运行所需的 64 位共享库和内核模块,如PAM安全模块等;ESXi作为64位系统,会优先从 /lib64 加载模块
  • /usr – 包含大部分可执行文件、脚本和支持包工具,尤其是vm-support本身的脚本通常位于 /usr/lib/vmware/vm-support/
  • /var – 记录系统日志(/var/log/*)、核心转储(/var/core/*)及暂存数据,用于事后分析,如果曾经有过紫屏PSOD,会有紫屏日志放在var/core/vmkernel-zdump.*
  • /vmfs – ESXi上挂载所有VMFS数据存储的目录,通常在 /vmfs/volumes/ 下按UUID组织,包含虚拟机磁盘、配置文件等

我们来分4个方向去解析vm-support,来看看怎么在vm-support里找到我们所需要的信息

  • 虚拟机VM
  • ESXi主机
  • 网络
  • 存储

怎么在vm-support里看VM虚拟机方面的问题

虚拟机的日志路径:\vmfs\volumes\datastore uuid\vm name\vmware.log

每一个虚拟机有自己独立的路径

细分类型日志路径搜索关键字解释
VM数量\etc\vmware\hostd\vmInventory.xml所有在该ESXi上开着机的VM列表
看VM配置\vmfs\volumes\\\.vmxnumvcpus该虚拟机vCPU数量
memSize内存大小
guestOS看该VM装了什么系统
VM开机/关机时间原因\vmfs\volumes\\\vmware.logCPU reset: softGuest OS initiated reset (OS里面按的)
详细见https://vmlib.com/check-vm-shutdown-reboot-reasons/PM Soft OffGuest OS initiated shutdown  (OS里面按的)
CPU reset: hardvSphere API call to restart (外面按的)
MKS local poweroffvSphere API call to poweroff (外面按的,作用类似拔电源)
Tools: sending ‘OS_Halt’ (state = 1)vSphere API call to shutdown (外面按的)
PM Soft Off. Good-bye.vSphere API call to shutdown (外面按的)
vMotion问题\vmfs\volumes\\\vmware.logmid id找migration id, 搜’mid id’
上面找到的mid idvmware.log搜mid id,可以看source和destination
\var\run\log\hostd.log上面找到的mid idhostd.log搜mid id,可以看vmotion过程

怎么在vm-support看ESXi主机方面的信息

日志路径搜索关键字解释
\commands\date.txt拿vm-support的时间
.\commands\esxcfg-info_-a.txt.FRAG-00000Product Name看服务器型号
Vendor Name看服务器厂商
Serial Number看服务器序列号
.\commands\python_usrlibvmwarevm-supportbinsystemStorageDebugpyc.txtHostname看ESXi主机名字
\commands\localcli_software-profile-get.txt看升级/打补丁记录
\commands\localcli_software-vib-list.txt看ESXi装了的VIB软件包列表
\commands\esxcfg-module_-q.txt看module模块,如看下migrate module是否有启用
\var\run\log\vmksummary.log看该ESXi的uptime, 和VMs数量

怎么在vm-support里诊断网络问题

细分类型日志路径搜索关键字解释
看配置\commands\nicinfo.sh.txtvmnic看有多少个物理网口,如vmnic0,1,2,3
Firmware Version看网卡的固件版本
Driver Info看网卡所使用的驱动名称,如qfle3
\commands\localcli_software-vib-list.txtqfle3看网卡的驱动版本
\commands\esxcfg-vmknic_-l.txt看vmkernel port信息,如ESXi管理IP地址, vMotion IP地址, MTU
\commands\esxcfg-vswitch_-l.txt看vswitch信息,如
看日志
\var\run\log\vobd.log
linkstate is看物理网口up/down记录
\var\run\log\vmkernel.log在相应时间节点在vm内核日志看下有没网络相关的错误

怎么在vm-support里看存储相关的问题

细分类型日志路径搜索关键字解释
看存储配置\commands\localcli_storage-core-adapter-list.txt看HBA
\commands\localcli_storage-san-sas-list.txt看SAS HBA的固件版本和驱动名字,如smartpqi
\commands\localcli_software-vib-list.txt上面找到的smartpqi看SAS HBA的驱动版本
\commands\localcli_storage-san-fc-list.txt看FC SAN HBA的固件版本和驱动名字,如qedf
\commands\localcli_software-vib-list.txt上面找到的qedf看SAN HBA的驱动版本
\commands\df.txt看Datastore的空间%
\commands\localcli_storage-filesystem-list–i.txt看Datastore的UUID, 挂载点Mount Point的UUID
\commands\esxcfg-scsidevs_-m.txt看Datastore和硬件的映射关系(找datastore底层device的naa.id)
\commands\localcli_storage-core-device-list.txt上面找到的naa.600508b1001c52ce4cb1772dddedbd62搜naa.id,看该设备的参数,如vendor, RAID level, 是否ssd, 是否offline, 是否支持VAAI,RDM等
\commands\esxcfg-mpath_-b.txt看SAN的multipath多路径配置
看存储相关的日志\var\run\log\vmkernel.logScsiDeviceIOhttps://knowledge.broadcom.com/external/article?legacyId=289902
CmdSN
All Paths Down state
0x28https://www.t10.org/lists/2status.htm
TimedOut存储心跳超时
\var\run\log\vmkwarning.logperformance has deteriorated存储性能下降
\var\run\log\hostd.logLost access to volume存储卷断开
Successfully restored access to volume存储卷恢复
\var\run\log\vobd.logesx.problem.vmfs.heartbeat.timedout存储心跳超时
esx.problem.vmfs.heartbeat.recovered存储心跳恢复
connection failure存储网络连接失败

图书推介 - 京东自营

24小时热门

还有更多VMware问题?

免费试下我们的VMware技术助理(已接Deepseek)!即时解答VM难题 → 🤖VM技术助理


########

扫码加入VM资源共享交流微信群(请备注加群

需要协助?或者只是想技术交流一下,直接联系我们!

推荐更多

怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略
疑难杂症

怎么分析ESXi主机日志vm-support?| VMware日志解读分析全攻略

本文介绍了如何获取并逐层解压 ESXi 主机的 vm‑support 日志包,重点关注 /commands 和 /var/run/log 等关键目录,以便提取 vmkernel.log、hostd.log 等核心日志文件。文章从虚拟机、主机、网络和存储四个维度,详细说明了日志路径、常见关键字及排查思路,如通过 vmware.log 定位 VM 重启原因、通过 NIC 信息及 vobd.log 分析网络链路问题、通过 SCSI 日志及 multipath 配置诊断存储故障。每一部分均给出对应的命令输出文件和日志搜索关键词,帮助运维人员快速定位各类故障。读者可依此流程,高效完成 ESXi 日志的故障排查与诊断。

机房巡检报告6大必备要素 | 附送3个最典型的机房巡检报告模板
运维必备

机房巡检报告6大必备要素 | 附送3个最典型的机房巡检报告模板

本文首先阐述机房巡检报告的定义与价值,强调通过对环境、设备、安全及运行状态的定期检查,为数据中心稳定运行提供决策支持与趋势洞察;接着详细解读报告的六大必备要素:基本信息、环境状况、硬件与软件清单、电力与制冷系统、网络与安全设施,以及检查发现与优化建议;随后附送三套典型模板,分别适用于季度深度巡检、月度例行巡检和服务器专项巡检,可满足不同规模与场景需求;最后通过这些范本与要素指导,帮助运维人员优化巡检流程,提高报告质量和效率。

VMware Workstation:如何让虚拟机仅连接宿主机的WiFi网络
VMware快速入门

VMware Workstation:如何让虚拟机仅连接宿主机的WiFi网络

本文详解如何在 VMware Workstation 中将虚拟机网络设置为仅桥接宿主机的 WiFi 网卡,避免连接有线或其他网络。通过虚拟网络编辑器精准选择无线网卡,实现网络隔离与灵活测试环境。适用于有 WiFi 网络测试需求的虚拟化用户和开发者。

VMware vSphere等产品非永久许可过期和试用期到期会出现什么问题?
VMware快速入门

VMware vSphere等产品非永久许可过期和试用期到期会出现什么问题?

本文介绍了VMware vSphere(ESXi、vCenter Server、vSAN)在非永久许可证(试用评估期或订阅型许可)到期后,会出现主机断开连接、虚拟机无法启动或修改、新存储无法添加等功能限制。建议用户提前关注到期提醒,及时续订或更换订阅型许可,确保生产环境稳定运行。

//madurird.com/4/9119499