管理 VMware 告警

OpManager 的动态告警与阈值功能是其主动监控能力的核心。OpManager 会像接收 SNMP Trap 一样,无缝获取来自每个 vCenter/ESX 主机的事件。目前已支持一组重要事件,并在每个版本中持续更新。除此之外,OpManager 还会监控关键性能指标的阈值并触发告警。

若要根据你的需求定制该系统,并修改各性能监视器的预设阈值,请转到主机 / 虚拟机(VM)/ 数据存储(Datastore)的快照页面下的“监视器(Monitors)”部分。

OpManager 中 VMware 告警管理:OpManager 监视器选项卡下的 VM 监视器列表

要查看完整的 VMware 监视器列表:

  • 要查看完整的 VMware 监视器列表,请导航到 Settings → Performance Monitors,并使用 ‘VIWebService’ 协议进行过滤。
  • Performance Monitors 选项卡下,单击 “Actions”,然后单击 “Add Performance Monitor”。这会显示 OpManager 中所有可用的性能监视器列表。
  • 若只查看 VMware 主机的性能监视器列表,请导航到 VMware-Host Monitors 部分。
  • 若查看 VMware 虚拟机的性能监视器列表,请导航到 VMware - VM snapshot page - Monitors tab - VM Monitors 部分。
  • 若查看数据存储的性能监视器列表,请导航到 VMware - Datastore snapshot page - Monitors tab - Datastore Monitors 部分。
  • 你也可以在对应的设备模板下,单击 “Add Monitors” 来查看并添加主机/VM 的性能监视器。

表 1:OpManager 支持的部分与主机、数据存储及 VM 相关的关键性能指标阈值监视器列表

序号阈值监视器虚拟设备类型资源
1.Host Network Received Packets(主机网络接收数据包)HostNetwork
2.Host Network Transmitted Packets(主机网络发送数据包)HostNetwork
3.Host Network Usage (avg)(主机网络使用率(平均))HostNetwork
4.Host CPU Utilization (avg)(主机 CPU 利用率(平均))HostCPU
5.Host Memory Utilization (avg)(主机内存利用率(平均))HostMemory
6.Host Disk Read Latency(主机磁盘读取延迟)HostDisk
7.Host Disk Write Latency(主机磁盘写入延迟)HostDisk
8.Datastore Freespace(数据存储可用空间)HostNetwork
9.VirtualMachine Network Packets Received(虚拟机网络接收数据包)VMNetwork
10.VirtualMachine Network Packets Transmitted(虚拟机网络发送数据包)VMNetwork
11.VirtualMachine Network Usage (avg)(虚拟机网络使用率(平均))VMNetwork
12.VirtualMachine CPU Utilization (avg)(虚拟机 CPU 利用率(平均))VMCPU
13.VirtualMachine Memory Usage (avg)(虚拟机内存使用率(平均))VMMemory

 

表 2:OpManager 支持的部分 VCenter / ESX 主机事件

序号事件虚拟设备类型严重性
1.VmFailedToPowerOffEvent(虚拟机关机失败事件)VMCritical(严重)
2.VmPoweredOffEvent(虚拟机关机事件)VMAttention(注意)
3.VmPowerOffOnIsolationEvent(隔离时虚拟机关机事件)VMClear(清除)
4.VmFailedToPowerOnEvent(虚拟机开机失败事件)VMCritical(严重)
5.VmPoweredOnEvent(虚拟机开机事件)VMAttention(注意)
6.VmFailedToSuspendEvent(虚拟机挂起失败事件)VMCritical(严重)
7.VmSuspendedEvent(虚拟机挂起事件)VMAttention(注意)
8.VmFailedToRebootGuestEvent(虚拟机客户机重启失败事件)VMCritical(严重)
9.VmGuestRebootEvent(虚拟机客户机重启事件)VMClear(清除)
10.VmFailoverFailed(虚拟机故障切换失败)VMTrouble(故障)
11VmPrimaryFailoverEvent(虚拟机主故障切换事件)VMCritical(严重)
12.VmUpgradeFailedEvent(虚拟机升级失败事件)VMCritical(严重)
13.VmUpgradeCompleteEvent(虚拟机升级完成事件)VMClear(清除)
14.VmDisconnectedEvent(虚拟机断开连接事件)VMAttention(注意)
15.VmConnectedEvent(虚拟机连接事件)VMAttention(注意)
16.VmDiskFailedEvent(虚拟机磁盘故障事件)VMCritical(严重)
17.VmRelocatedEvent(虚拟机迁移完成事件)VMAttention(注意)
18.VmRelocateFailedEvent(虚拟机迁移失败事件)VMCritical(严重)

你可以在 Settings → Monitors → VMware Events 下查看 OpManager 支持的完整 ESX 主机 / vCenter 事件列表。

注意:OpManager 只会基于 VMware 事件触发告警,这些告警在问题/通知被处理完成后需要手动清除。

除此之外,你还可以在 OpManager 中为 VMware 的父设备启用基于物理网卡(Physical NIC)/ 主机总线适配器(Host Bus Adapter,HBA)的告警。可以在发现该父设备时,或在“Update Inventory”页面中启用 “Raise alerts for Physical NIC & Host Bus Adapter” 选项来开启这些告警。以下是 OpManager 中可用的状态消息及其对应的 NIC/HBA 状态:

物理网卡(Physical NIC)状态消息:

序号OpManager 状态消息对应的 NIC 状态
1Clear(清除)Connected(已连接)
2Critical(严重)Disconnected(已断开)

主机总线适配器(Host Bus Adapter)状态消息:

序号OpManager 状态消息对应的 HBA 状态
1Clear(清除)Online(在线)
2Attention(注意)Unbound 或 Offline(未绑定 或 离线)
3Trouble(故障)Fault(故障)

若要深入了解 OpManager 的 VMware 监控实践,请查看以下帮助文档。

感谢您的反馈!

此内容对您有帮助吗?

很抱歉给您带来不便。请帮助我们改进此页面。

我们该如何改进此页面?
您是否需要有关此主题的协助?
点击“提交”,即表示您同意根据隐私政策处理个人数据。