可用性监视 - 故障排除

1.错误:“无法联系IP驱动程序。常规故障'

OpManager服务器在定期可用性状态轮询期间无法联系被监控设备时,将生成此告警消息。此错误通常出现在虚拟设备运行任何 Windows 操作系统的 VM 环境中,并且由于以下任何原因而无法访问网络外部时。

错误:Hyper V – WinSock 问题

原因:

当 WinSock 和 WinSock2 设置可能已损坏时,VM 中会发生此错误。

解决方法:

您可以尝试指向以下注册表路径:

    • HKLM\SYSTEM\CurrentControlSet\Services\WinSock
    • HKLM\SYSTEM\CurrentControlSet\Services\WinSock2
  1. 备份上述注册表。
  2. 转到另一台服务器(运行相同的操作系统配置),转到上面的注册表路径,导出注册表并将它们复制到当前服务器。
  3. 双击注册文件进行注册,重新启动系统以查看其工作原理。

错误:VM 重复安全标识符问题

原因:

此问题是由 Windows 2008 或 Windows 2012 虚拟机中的重复安全标识符 (SID) 导致的,当它们中的任何一个是从模板或克隆的虚拟机部署时。部署虚拟机时,未选择客户机自定义选项。

解决方法:

若要解决此问题,需要运行 sysprep 工具为虚拟机生成新的安全标识符。为此,

  1. 打开受影响的 Windows 虚拟机的控制台。
  2. 在提升模式下打开命令提示符。右键单击 Windows 命令处理器的快捷方式,然后选择以管理员身份运行选项。
  3. 将路径更改为 C:\Windows\System32\sysprep。
  4. 运行 sysprep 命令。
  5. 当 sysprep 向导出现时,选中 generalize 复选框,将所有其他设置保留为默认值。
  6. 重新引导虚拟机以应用更改。

错误:TCP/IP 问题

原因:

当您无法 ping 回环回地址/本地设置时,您的 TCP/IP 堆栈可能会损坏。

解决方法:

关闭用户帐户控制 (UAC) 并使用域管理员帐户登录。按照以下步骤将 TCP/IP 重置为其原始状态:

    1. 在“开始”屏幕上,键入 CMD。在搜索结果中,右键单击“命令提示符”,然后选择“以管理员身份运行”。
    2. 在命令提示符下,输入下面给出的命令,然后按 Enter。

netsh int ip 重置resetlog.txt

  1. 重新启动计算机。

运行 reset 命令时,它会覆盖以下注册表项,这两个注册表项都由 TCP/IP 使用:

  • SYSTEM\CurrentControlSet\Services\Tcpip\Parameters
  • SYSTEM\CurrentControlSet\Services\DHCP\Parameters

2. 错误:设备可用性报表中的可用性值不匹配

“设备可用性”报表中的“正常运行时间”列显示不正确的值,即使可用性为 100%。

原因:

根据生成报表时指定的时间段,从每小时或每天归档表中获取报表中的可用性数据。默认情况下,该值将为“过去 24 小时”。然而,在设备快照页面中,可用性数据是从原始表中获取的。如果生成的报表的“正常运行时间”列中存在值不匹配,则根本原因可能是由于相应归档表中缺少该时间段的条目。
例如,如果可用性监视间隔为 15 分钟,则原始表将有 4 个条目,持续 1 小时。将计算这 4 个值的平均值并将其推送到小时表。在小时表归档期间,如果OpManager服务关闭或数据库断开连接(如果是MSSQL),则小时表中的更新将失败。这会导致在生成的报表中报表不正确的数据。

解决方案:

这是一个特定于环境的问题。请密切关注您的数据库停机时间或OpManager服务器的不可用情况,以避免此类问题。