管理 VMware 告警

OpManager的动态告警和阈值功能是主动监控方法的核心。OpManager从每个vCenter/ESX主机无缝获取事件,类似于SNMP陷阱。目前,支持重要事件列表,并且此列表在每个版本中都会更新。除了这些事件之外,OpManager还监控关键性能指标的阈值并发出告警。

要根据您的要求定制此系统,并更改每个性能监视器的预设阈值,请转到主机/虚拟机/数据存储的快照页面下的监视器部分。

Vm alert monitors

要查看 VMware 监视器的完整列表,请执行以下操作:

  • 转到 VMware 主机快照页面中的监控选项卡。导航到资源清单 -> 设备,然后单击设备以查看其快照页面。
  • 性能监视器选项卡下,单击“操作”,然后单击“添加性能监视器”。这将显示OpManager中所有可用的性能监视器的列表。
  • 要仅查看 VMware 主机的性能监视器列表,请向下滚动到 VMware 主机监视器部分。
  • 要查看虚拟机的性能监视器列表,请向下滚动到VMware - 虚拟机监控器”部分。
  • 要查看数据存储的性能监视器列表,请向下滚动到 VMWare - 数据存储监视器部分。
  • 您还可以通过单击主机/虚拟机相应设备模板下的添加监视器来查看和添加主机/虚拟机的性能监视器。

表1:OpManager支持的与主机、数据存储和虚拟机相关的关键性能指标的几个阈值监视器列表

 

编号阈值监视器虚拟设备类型资源
1.主机网络接收的数据包主机网络
2.主机网络传输的数据包主机网络
3.主机网络使用情况(平均)主机网络
4.主机 CPU 使用率(平均)主机中央处理器
5.主机内存利用率(平均)主机内存
6.主机磁盘读取延迟主机磁盘
7.主机磁盘写入延迟主机磁盘
8.数据存储空闲空间主机网络
9.收到的虚拟机网络数据包虚拟机网络
10.传输的虚拟机网络数据包虚拟机网络
11.虚拟机网络使用情况(平均)虚拟机网络
12.虚拟机 CPU 使用率 (平均)虚拟机中央处理器
13.虚拟机内存使用情况(平均)虚拟机内存

 

表2:OpManager支持的VCenter / ESX主机事件很少

编号事件虚拟设备类型严重级别
1.VmFailedToPowerOffEvent虚拟机危急
2.VmPoweredOffEvent虚拟机需要关注的
3.VmPowerOffOnIsolationEvent虚拟机正常
4.VmFailedToPowerOnEvent虚拟机危急
5.VmPoweredOnEvent虚拟机需要关注的
6.VmFailedToSuspendEvent虚拟机危急
7.VmSuspendedEvent虚拟机需要关注的
8.VmFailedToRebootGuestEvent虚拟机危急
9.VmGuestRebootEvent虚拟机正常
10.VmFailoverFailed虚拟机有问题的
11VmPrimaryFailoverEvent虚拟机危急
12.VmUpgradeFailedEvent虚拟机危急
13.VmUpgradeCompleteEvent虚拟机正常
14.VmDisconnectedEvent虚拟机需要关注的
15.VmConnectedEvent虚拟机需要关注的
16.VmDiskFailedEvent虚拟机危急
17.VmRelocatedEvent虚拟机需要关注的
18.VmRelocateFailedEvent虚拟机危急

您可以在VMware Events的设置→监视器下查看OpManager支持的ESX主机/vCenter事件的完整列表。

注意: OpManager仅根据VMware事件触发告警,一旦处理完问题/通知,就必须手动清除告警。

除此之外,您还可以在OpManager中为VMware父设备启用基于物理网卡/主机总线适配器的告警。这些告警可以在发现该父设备期间启用,也可以通过启用引发物理网卡和主机总线适配器的告警选项从“更新清单”页面启用。这些是OpManager及其NIC/HBA等效项中的可用状态消息:

物理网卡状态消息:

编号OpManager状态消息相应的 NIC 状态
1正常连接
2危急断开

主机总线适配器状态消息:

编号OpManager状态消息相应的 HBA 状态
1正常在线
2需要关注的未绑定(或脱机)
3有问题的故障

要深入了解OpManager的VMware监控实践,请浏览以下帮助文档。