OpManager 的动态告警与阈值功能是其主动监控能力的核心。OpManager 会像接收 SNMP Trap 一样,无缝获取来自每个 vCenter/ESX 主机的事件。目前已支持一组重要事件,并在每个版本中持续更新。除此之外,OpManager 还会监控关键性能指标的阈值并触发告警。
若要根据你的需求定制该系统,并修改各性能监视器的预设阈值,请转到主机 / 虚拟机(VM)/ 数据存储(Datastore)的快照页面下的“监视器(Monitors)”部分。
要查看完整的 VMware 监视器列表:
表 1:OpManager 支持的部分与主机、数据存储及 VM 相关的关键性能指标阈值监视器列表
| 序号 | 阈值监视器 | 虚拟设备类型 | 资源 |
|---|---|---|---|
| 1. | Host Network Received Packets(主机网络接收数据包) | Host | Network |
| 2. | Host Network Transmitted Packets(主机网络发送数据包) | Host | Network |
| 3. | Host Network Usage (avg)(主机网络使用率(平均)) | Host | Network |
| 4. | Host CPU Utilization (avg)(主机 CPU 利用率(平均)) | Host | CPU |
| 5. | Host Memory Utilization (avg)(主机内存利用率(平均)) | Host | Memory |
| 6. | Host Disk Read Latency(主机磁盘读取延迟) | Host | Disk |
| 7. | Host Disk Write Latency(主机磁盘写入延迟) | Host | Disk |
| 8. | Datastore Freespace(数据存储可用空间) | Host | Network |
| 9. | VirtualMachine Network Packets Received(虚拟机网络接收数据包) | VM | Network |
| 10. | VirtualMachine Network Packets Transmitted(虚拟机网络发送数据包) | VM | Network |
| 11. | VirtualMachine Network Usage (avg)(虚拟机网络使用率(平均)) | VM | Network |
| 12. | VirtualMachine CPU Utilization (avg)(虚拟机 CPU 利用率(平均)) | VM | CPU |
| 13. | VirtualMachine Memory Usage (avg)(虚拟机内存使用率(平均)) | VM | Memory |
表 2:OpManager 支持的部分 VCenter / ESX 主机事件
| 序号 | 事件 | 虚拟设备类型 | 严重性 |
|---|---|---|---|
| 1. | VmFailedToPowerOffEvent(虚拟机关机失败事件) | VM | Critical(严重) |
| 2. | VmPoweredOffEvent(虚拟机关机事件) | VM | Attention(注意) |
| 3. | VmPowerOffOnIsolationEvent(隔离时虚拟机关机事件) | VM | Clear(清除) |
| 4. | VmFailedToPowerOnEvent(虚拟机开机失败事件) | VM | Critical(严重) |
| 5. | VmPoweredOnEvent(虚拟机开机事件) | VM | Attention(注意) |
| 6. | VmFailedToSuspendEvent(虚拟机挂起失败事件) | VM | Critical(严重) |
| 7. | VmSuspendedEvent(虚拟机挂起事件) | VM | Attention(注意) |
| 8. | VmFailedToRebootGuestEvent(虚拟机客户机重启失败事件) | VM | Critical(严重) |
| 9. | VmGuestRebootEvent(虚拟机客户机重启事件) | VM | Clear(清除) |
| 10. | VmFailoverFailed(虚拟机故障切换失败) | VM | Trouble(故障) |
| 11 | VmPrimaryFailoverEvent(虚拟机主故障切换事件) | VM | Critical(严重) |
| 12. | VmUpgradeFailedEvent(虚拟机升级失败事件) | VM | Critical(严重) |
| 13. | VmUpgradeCompleteEvent(虚拟机升级完成事件) | VM | Clear(清除) |
| 14. | VmDisconnectedEvent(虚拟机断开连接事件) | VM | Attention(注意) |
| 15. | VmConnectedEvent(虚拟机连接事件) | VM | Attention(注意) |
| 16. | VmDiskFailedEvent(虚拟机磁盘故障事件) | VM | Critical(严重) |
| 17. | VmRelocatedEvent(虚拟机迁移完成事件) | VM | Attention(注意) |
| 18. | VmRelocateFailedEvent(虚拟机迁移失败事件) | VM | Critical(严重) |
你可以在 Settings → Monitors → VMware Events 下查看 OpManager 支持的完整 ESX 主机 / vCenter 事件列表。
注意:OpManager 只会基于 VMware 事件触发告警,这些告警在问题/通知被处理完成后需要手动清除。
除此之外,你还可以在 OpManager 中为 VMware 的父设备启用基于物理网卡(Physical NIC)/ 主机总线适配器(Host Bus Adapter,HBA)的告警。可以在发现该父设备时,或在“Update Inventory”页面中启用 “Raise alerts for Physical NIC & Host Bus Adapter” 选项来开启这些告警。以下是 OpManager 中可用的状态消息及其对应的 NIC/HBA 状态:
物理网卡(Physical NIC)状态消息:
| 序号 | OpManager 状态消息 | 对应的 NIC 状态 |
|---|---|---|
| 1 | Clear(清除) | Connected(已连接) |
| 2 | Critical(严重) | Disconnected(已断开) |
主机总线适配器(Host Bus Adapter)状态消息:
| 序号 | OpManager 状态消息 | 对应的 HBA 状态 |
|---|---|---|
| 1 | Clear(清除) | Online(在线) |
| 2 | Attention(注意) | Unbound 或 Offline(未绑定 或 离线) |
| 3 | Trouble(故障) | Fault(故障) |
若要深入了解 OpManager 的 VMware 监控实践,请查看以下帮助文档。
感谢您的反馈!