公司新闻

为什么每个IT管理员都需要硬件监控?

根据今年4月发布的《 ITIC 2020年全球服务器硬件,服务器操作系统可靠性报告》的结论,因企业未能及时对硬件进行翻新或升级以适应激增的工作量,所以那些使用了四年以上的服务器可靠性普遍下降了67%左右。这凸显了企业对硬件监控解决方案的迫切需求。

为什么硬件监控对于企业网络至关重要?

当IT管理员有效地管理电源设备时,不仅可以减少电力成本,还可以提高数据中心的效率,并延长服务器和其他IT设备的使用寿命。

优质的硬件监控需要具备哪些特点?

1.硬件监控需要能够读取和显示来自不同传感器的数据来监控硬件属性。这些硬件属性可以直接反应硬件的运行状况和性能。常规测量的硬件指标包括温度传感器,风扇速度,电源单元(PSU),电池,主板,CPU,内存单元,磁盘等。

2.就像我们常常使用不同品牌的家用电器一样,网络设备也由于非同一厂商而硬件不同。这就是为什么兼容多厂商,甚至厂商未知的硬件监控对于网络硬件监控至关重要。

3.如果您的IT环境分布在不同的位置,则必须使用远程硬件监控,因为您需要确保可以远程及时监控硬件设备。硬件监控工具还需要直接从服务器或网络运营中心(NOC)支持分布式网络硬件监控。

【OpManager监控实例】

使用OpManager监控电源设备

了解电源波动有助于避免设备故障引起的停电。可以通过OpManager监控和测量硬件组件的电源,例如电压和电流。监控PSU冗余以防止设备故障或短路。

为什么每个IT管理员都需要硬件监控?

使用OpManager监控风扇速度

OpManager可以通过SNMP监控A10网络负载平衡器和WAN加速器的风扇状态,测量Cisco UCS风扇速度和排气温度,并使用SNMP测量F5网络负载平衡器的CPU风扇速度。对于IBM服务器,OpManager也可以使用SNMP协议获取转速表读数形式的风扇速度。

监控风扇速度

使用OpManager监控CPU温度

除了监控电源和风扇速度之外,监控CPU温度也至关重要,因为它会直接影响网络设备的性能。OpManager监控CPU温度,显示网络设备上所有可用的温度数据。以及显示有关风扇速度,内存利用率,处理器的时钟速度以及其他与机箱相关信息的数据。

监控CPU温度

OpManager提供的硬件告警告警抑制

有时网络管理员会在维护或停机期间拔下电源卡,在此期间告警可能会随时出现在用户界面。为了避免这种情况,OpManager提供了硬件告警抑制功能。要在OpManager中抑制特定设备的硬件监控告警,可以配置告警状态和抑制动作。

OpManager——最佳的硬件监控

1. OpManager跟踪网络上所有设备的运行状况,可用性和正常运行时间,以及CPU,内存和磁盘。它还可以监控温度,风扇速度,电源等。这些至关重要的资源,可为服务和监控指标(例如利用率,速度,空闲时间,I / O读写),可用空间和处理器队列提供强力支撑。

2. OpManager使用SNMP监控HP,Cisco,Juniper,Checkpoint和Nexus网络设备的硬件指标和KPI,还有戴尔服务器;以及用于VMware ESX服务器的VMware VIJava API。

3. 借助OpManager的通知和告警配置文件和机制以及大量的硬件运行状况报表,您无需担心停机导致的意外硬件故障。此外,借助预先集成在OpManager中的Slack,ServiceNow,ServiceDesk Plus,IT监控将会变的轻而易举。

 

推荐阅读:

1.运行时间的监控:对您的业务至关重要

2.IT管理员需要的10大网络工具