故障解决方法 CCenter exe 应用程序错误开机怎么回事

机房半夜停电时间过长,UPS没撑到电力恢复,结果平台上的大部分业务虚拟机都无法启动,且名称变成数字乱码,造成的后果很严重,因为主要业务都无法访问了,真是惊恐万分,心都凉了,还好冷静下来分析故障原因,最后总算修复了,全部虚拟机最终恢复正常启动运行,数据也未丢失,特此给大家分享一下解决方法 。
故障平台:VMware vSphere 6.7
故障现象:平台虚拟机均无法正常启动,名称变成数字乱码 。
先是查看了下vCenter Server 的事件选项卡,看到存在数据存储损坏问题事件 。
然后查看vmkernel.log 日志文件,看到了类似如下所示的错误信息:
Volume 40fd60a3-3abbe1ae2-3247-0017a4bb0402 (“<Datastore_XX>”) may be damaged on disk. Corrupt heartbeat detected at offset 3305972: [HB state 0 offset 605284589918532624
到官网知识库扒了一下,说是遇到这种情况需要检查元数据一致性 。
【故障解决方法 CCenter exe 应用程序错误开机怎么回事】操作方法:开启ESXI主机SSH服务,从 ESXi 主机上的 CLI 中运行 VOMA 。VOMA 可用于检查并修复 VMFS 数据存储或支持 VMFS 数据存储的逻辑卷的轻微不一致问题 。
VOMA相关功能如下图一:

故障解决方法 CCenter exe 应用程序错误开机怎么回事

文章插图

图一
VOMA相关命令如下图二:

故障解决方法 CCenter exe 应用程序错误开机怎么回事

文章插图

图二
具体修复过程:
1、先开启ESXI服务器的SSH服务,使用root帐号连接到服务器的CLI控制台 。
2、查看/vmfs/devices/disks下的虚拟磁盘,假定要修复的是eui.225c0032654ccba5:1,
输入命令voma -m vmfs -f check -d
/vmfs/devices/disks/eui.225c0032654ccba5:1,再按下回车键,让它进行vmfs文件系统元数据检查,若发现类似“ON-DISK ERROR:xxxxx”这样的信息,表明vmfs元数据确实有错误 。
3、最后使用命令voma -m vmfs -f fix -d
/vmfs/devices/disks/eui.225c0032654ccba5:1修复vmfs元数据 。关注下修复结果:Total Errors found;Total Errors Fixed,如果都有数字,表明修复成功了 。
4、最后验证修复结果,如果虚拟机都恢复正常启动,表明方案有效,如果没有正常启动,可尝试重新注册虚拟机后,再次重新启动虚拟机,若成功表明方案有效,若以上方法试过,还是无法正常启动虚拟机,表明该方案药不症,需要再次查看相关日志,查找下相关知识库,对症下药 。
5、建议虚拟化平台的相关操作应该慎之又慎,因为平台往往有很多虚拟机及大量数据,涉及业务面广,出现故障是灾难性的,因此平时最好利用专业数据备份软件或者官方的Site Recovery加强对虚拟机的保护 。