正常运行时间监控

正常运行时间是系统可靠性的度量,表示为机器工作和可用时间的百分比。

当提到IT网络时,正常运行时间是对网络设备、网站和其他服务可用性的度量。

网络正常运行时间通常用百分比来衡量,例如五个9秒,这意味着系统的运行时间达到99.999%。网络正常运行时间监控的目标是拥有99.999%的可用性,也就是每年少于5分钟的停机时间。停机时间是系统不能运行的一段时间,与正常运行时间相反。

使用ManageEngine OpManager监控网络正常运行时间

网络正常运行时间监控主动监控您的整个IT网络环境,以确保它可用并工作。可以把正常运行时间监控看作是你可以信赖的24/7的在线安全卫士。当监控系统注意到网络设备或服务宕机时,它会从一个仪表板立即通知您,以便您的网络管理员可以在问题变得太严重之前解决它。正常运行时间监控的目的是确保您的网络操作尽可能不间断。

术语网络正常运行时间和停机时间用于定义IT服务提供的成功级别。服务水平协议(SLA)通常包括正常运行时间和宕机时间比率,它们显示服务预计保持运行的时间。IT专业人员使用正常运行时间来表示连续运行的总时间。

如何网络正常运行时间监控工作?

网络正常运行时间监控为您提供了所需的可见性,以便提前一步发现潜在问题。通过在易于阅读的界面中显示实时网络性能数据,网络正常运行时间监控软件可以帮助您识别可能导致瓶颈的中断。能够实时检测威胁意味着您可以随时随地得到通知,并立即采取纠正或防御立场。您可以节省时间和金钱,并且不再需要物理系统管理员一直在现场执行手动检查。网络正常运行时间的监控:

  • 跟踪网络设备的可用性和带宽使用情况,以检测任何潜在的瓶颈。
  • 监控服务器的正常运行时间,包括DNS服务器、SQL服务器、邮件服务器、FTP服务器和虚拟服务器的正常运行时间。
  • 监控你的网站的可用性和检查坏的链接。
  • 确定停机和网络性能问题的根本原因。
  • 关于SLA的报告:生成SLA报告来帮助您跟踪可用性和性能,以便您能够满足对客户的SLA承诺。

使用ManageEngine OpManager进行网络正常运行时间监控

ManageEngine OpManager帮助确保所有网络设备、服务和网站都是全天候运行的。OpManager的接口提供有关网络正常运行时间和单个服务可用性的实时统计数据。仪表板使用绿色、黄色和红色指示符等可视化提示显示关于网络设备、服务和网站的状态和运行状况的报告,帮助您锁定关键指标。

OpManager提供各种正常运行时间监控,包括:

  • 设备正常运行时间的监控
  • 界面运行监控
  • 服务运行监控
  • Windows服务正常运行时间监控
  • 网站正常运行时间监控
  • 流程运行监控

设备正常运行时间监控:

持续监控整个网络的正常运行时间和网络可用性。OpManager每两分钟向被监控设备发送一个ping信号。如果连续两次ping之后没有响应,那么OpManager将认为该设备不可用。可以根据业务需要分配ping的数量及其时间间隔。

网络正常运行时间监控 - ManageEngine OpManager

作为一个正常运行时间监控工具,OpManager使用ICMP Ping来轮询设备的可用性。ping是IT管理员检测设备可用性的有效工具。

对于非icmp环境,特别是监控边缘路由器或DMZ区域设备的正常运行时间,可以使用Telnet。默认的可用性轮询间隔为5分钟,您可以根据需要将其定制为特定的设备组或特定的设备。

接口正常运行时间监控:

为企业网络和IT基础设施中的每个元素提供基于snmp的接口运行时间和端口可用性监控。它提供每日、每周、每月或自定义期间显示接口可用性的正常运行时间报告,以度量网络级别的可用性并确保满足sla。这些接口或端口状态通过单个设备状态、第2层网络映射、业务视图或自定义设备组和网络天气图跨多个方面传播。

网络设备正常运行时间监控 - ManageEngine OpManager

服务时间监控:

服务器是任何IT基础设施的核心元素。为了确保内部流程的平稳运行和服务的可用性,它们始终是可访问的,这一点至关重要。服务器正常运行时间,即服务器对用户可用的时间,是优化网络性能的最重要因素之一。

OpManager为您提供有关被监控的传输控制协议(TCP)服务的可用性和响应时间的详细图表和报告。OpManager中的服务监控功能是可定制的,您可以选择要监控的服务。

网络正常运行时间监控 - ManageEngine OpManager

Windows服务正常运行时间监控:

除了监控系统级服务之外,OpManager还支持使用Windows管理工具(WMI)监控Windows服务。与系统级服务监控类似,您可以发现任何Windows服务并使用OpManager监控它们。此外,管理员可以配置OpManager,使其在发现Windows服务从操作控制台关闭时自动重启服务或服务器。了解更多 >>

Windows网络正常运行时间监控 - ManageEngine OpManager

网站正常运行时间监控:

ManageEngine OpManager执行的关键任务是监控您的网站的可用性,每年365天24小时。它监控HTTP/ HTTPS url、内部网站点、web服务器场、带有登录的web应用程序、Windows NT LAN Manager (NTLM)认证的网站等等。除了URL正常运行时间监控之外,你还可以检查网站中的特定内容。网站可用性监控确保网站不受黑客攻击。

流程运行监控:

OpManager的进程正常运行时间监控使管理员能够远程监控和管理在服务器上运行的进程。OpManager使用各种协议,如SNMP、WMI和CLI,来监控运行在Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESX和VMware服务器和虚拟机等上的进程。

网络正常运行时间监控 - ManageEngine OpManager

更多地了解OpManager的流程可用性监控

如何计算设备的正常运行时间?

在一个特定的时间范围内,我们取设备停机的秒数,然后用这个数除以该时间范围内设备被监控的总秒数。因此,我们得到了停机百分比,然后将其从100%减去以确定正常运行时间百分比。

例子

假设我们监控了一个网络设备24小时(即86,400秒),在这段时间内,设备宕机了5分钟(300秒)。为了定义正常运行时间和宕机百分比,我们执行以下计算:

设备停机的总时间:300秒。

设备被监控的总秒数:86,400秒

300除以86,400,等于0.0035。

用百分比表示,这是0.35%这是停机时间百分比。

设备的正常运行时间百分比将是:100%减去0.35%等于99.65%。

注意:暂停、维护、依赖不可用、宕机、未被监控是按设备宕机时间计算的。