Windows集群监控


请按照下面给出的步骤在Applications Manager中创建新的Windows集群监视器:

  1. 点击新建监视器链接。

  2. 服务器类别下选择 Windows集群。

  3. 指定Windows集群的 显示名称
  4. 输入集群名称IP地址 集群

  5.  从下拉菜单中选择Windows Server的版本
  6. 您可以使用Cluster Domain Administrator 用户名  密码,也可以从凭证管理下拉菜单中选择凭证 。要使用您的Cluster Domain Administrator凭证,请确保该用户帐户有权执行 集群服务器节点中 root \ mscluster命名空间上WMI查询 。

     

  7. 选择 节点发现 选项。可用选项为 不发现节点 和发现并监控节点

    不发现节点 -选择此选项将不会发现集群服务器节点作为Windows Server。如果该节点已经添加为Windows服务器,则它将在内部进行关联以收集特定于集群的事件日志。

    发现和监控节点 -选择此选项将发现集群服务器节点作为Windows Server并监控可用性和性能。如果该节点已经添加为Windows服务器,则将不会再次发现该节点,并且现有服务器将在内部进行关联以收集特定于集群的事件日志。

  8. 选择 启用事件日志监控 选项:

    • 选中 -这将在所有集群服务器节点中启用事件日志监控。从配置的事件日志规则生成的事件将传播到集群。在服务器的事件日志收集期间,它还将收集集群事件,并将其添加到数据库中而不会生成告警。然后,在集群的数据收集期间,它将从所有节点的数据库中获取集群事件,然后为配置的Eventlog规则生成告警。
    • 未选中 -这将禁用集群中的事件日志监控。
      • 集群添加: 添加集群时,选择此选项将不会在发现的节点中启用事件日志监控。如果节点已经存在,则此选项会将当前事件日志状态保留在服务器中。
      • 集群更新: 如果在更新集群时选择了此选项,它将在所有服务器和集群中禁用事件日志监控。它还将从数据库中正常所有服务器和集群的与事件日志相关的告警和事件。因此,仅在必要时使用此选项。
  9. 输入轮询间隔 时间(以分钟为单位)。

  10.  从您要与监视器关联的组合框中选择 业务组(可选)。

  11. 点击 添加监视器

监控参数

Applications Manager的Windows集群监控功能包括监控集群详细信息,集群节点,资源组,集群性能,网络,磁盘利用率和存储状态。您还可以通过配置事件日志规则来监控集群事件。

 

Windows Cluster的监控详细信息以图形方式表示,有助于轻松了解参数。您还可以为所监控的属性配置阈值,并且在违反阈值的情况下,您可以通过关联操作来获得通知。这也将有助于在集群中发生故障转移时得到通知。

 

可用性标签,提供过去24小时或30天的可用性历史记录。 性能选项卡提供了过去24小时或30天的健康状况和事件。 列表视图使您可以执行 批量管理配置。点击列出的各个监视器,以查看以下信息。

 

监控的Windows集群属性在Applications Manager中的以下选项卡下分类:

概览

参数描述
集群详细信息

Cluster Name/IP Address

集群的名称/ IP地址

Quorum Owner Node 节点名称,当前拥有quorum资源。
Quorum Path quorum文件的路径。
Quorum Type 当前的Quorum类型。以下是可能的值:
  • 输入对象
  • 仅磁盘
  • NodeAndDiskMajority
  • NodeAndFileShareMajority
  • 多数节点
Number of Nodes 集群中的节点总数。
Max Nodes 可以参与集群的最大节点数。
Number of Networks 服务器集群用于通信的网络数。
Resources Online  当前在线的资源数。
Resources Offline  当前离线资源的数量。
Resource Groups Online  计算当前在线的资源组。
Resource Groups Offline  计算当前离线的资源组。
Disks in Use 集群中当前正在使用的磁盘数。
Number of Nodes 集群中的节点总数。
磁盘利用

Disk Used Percentage

集群中已使用磁盘空间的总百分比。
Disk Free Percentage 集群中可用磁盘空间的总百分比。
Disk Size 磁盘空间的总大小,以兆字节为单位。
Disk Used 磁盘中已使用的总空间,以兆字节为单位。
Disk Free 磁盘中可用的总可用空间,以兆字节为单位。
节点
Node Name 指定已知节点的标签。
State

指定节点的当前状态。节点状态可以是:

  • 正常-节点已物理插入,打开,引导并能够执行程序。
  • 停止-节点已关闭或无法运行。
  • 正在加入-节点正在加入集群。
  • 已暂停-节点正在运行,但未参与集群操作。
  • 未知-操作不成功。
资源控制和多播RR
Messages Outstanding 指定内部消息队列的长度。
RHS Processes 指定节点上正在运行多少资源主机监视器进程。
RHS Restarts 指定此节点上发生了多少资源主机监视器故障。
网络重新连接
Reconnect Count 指定TCP连接断开和重新建立的次数。


性能

参数描述
MULTICAST REQUEST REPLY
Messages Outstanding 指定内部消息队列的长度。
资源控制管理
RHS Processes 指定节点上正在运行多少资源主机监视器进程。
RHS Restarts 指定此节点上发生了多少资源主机监视器故障。
网络重新连接

 

Node Name 指定已知节点的标签。
Reconnect Count 指定TCP连接断开和重新建立的次数。
Normal Message Queue Length 指定队列中等待发送的消息数。
Normal Message Queue Length Delta 指定队列的入站消息速率。
Urgent Message Queue Length 指定队列中等待发送的紧急消息数。
Urgent Message Queue Length Delta 指定队列的入站消息速率。
资源类型统计
Resource Failure 指示资源主机监视器由于资源故障而终止的次数。
Resource Failure Access Violation 表示由于访问冲突导致资源故障导致资源主机监视器终止的次数。
Resource Failure Deadlock 指示资源主机监视器由于资源故障(由死锁引起)而终止的次数。

网络

参数描述
Name 指定网络的名称。
Address 提供整个网络或子网的地址。
Role 提供对网络的Role属性的访问,即网络在集群中的角色。以下是可能的值:
  • 无-集群不使用网络。
  • 集群-网络用于承载内部集群通信。
  • 客户端-网络用于将客户端系统连接到集群。
  • 两者-网络用于连接客户端系统并进行内部集群通信。
State 指定网络的当前状态。以下是可能的值:
  • 未知-操作不成功。
  • 不可用-网络上的所有网络接口都不可用,这意味着拥有网络接口的节点已关闭。
  • 发生故障-网络无法运行;网络上的所有节点都无法通信。
  • 已分区-网络正在运行,但是网络上的两个或更多节点无法通信。通常,发生特定于路径的问题。
  • 运行-网络正在运行;集群中的所有节点都可以通信。
网络消息
Bytes Received 每秒接收的字节数性能计数器显示每秒在网络上接收到的新集群消息字节数
Bytes Sent 已发送字节数/秒性能计数器显示每秒通过网络发送的新集群消息字节数。
Messages Received 每秒收到的消息数性能计数器显示每秒在网络上收到的新集群消息数。
Messages Sent 已发送消息/秒性能计数器显示每秒通过网络发送的新集群消息的数量。

存储

参数描述
Path 集群磁盘分区的路径(包括驱动器号,如果存在)。
Volume Label 指定对VolumeLabel 属性的访问,该 属性是分区的卷标。
Size 分区的总大小,以兆字节为单位。
Used 分区中已使用的总空间,以兆字节为单位
Free 分区可用的总可用空间,以兆字节为单位。
Used Percentage 分区中已用空间的百分比。
Free Percentage 分区中可用空间的百分比。

资源组

参数描述
Name 资源组的名称。
Current Node 资源组当前正在其中运行的节点。
Preferred Node 指示集群中资源组可以将其故障转移/故障回复到的首选节点名称
State 资源组的当前状态。以下是可能的值。
  • 未知
  • 在线
  • 离线
  • 失败
  • 部分在线
  • 待定

事件

 

参数描述
Rule Name
 
Windows集群事件日志规则的名称。
Log File Type 在其下创建事件日志规则的日志文件类型。Windows集群事件在系统日志文件中生成,但是Applications Manager用户可以在Applications Manager中的任何日志文件类型下为Cluster创建规则。因此,您可以看到在集群级别的所有服务器中生成的其他事件。
Node Name Windows集群节点的名称,其中生成了特定事件。
Source 指定与事件日志关联的源。
Event Id 指定与事件日志关联的事件ID
Type 事件类型-任何类型的事件,错误,警告和信息。注意: 如果发生安全事件,则成功审核和失败审核之间的类型将有所不同。
Describe 入站事件的描述内容
Generated Time 生成事件的时间。