SNMP Trap 监控

SNMP 定义

简单网络管理协议(SNMP)是一种被广泛使用的网络监控协议,帮助你监控通过 SNMP 连接的远程设备。

SNMP 的架构包含三个组件:SNMP 管理器、受管设备和 SNMP 代理。

  • SNMP 管理器是监控服务器,负责发送请求并收集监控数据。
  • 受管设备是被监控的设备。例如:打印机、服务器、router、交换机。
  • SNMP 代理安装在受管设备上,它向管理器发送所需的响应。

什么是 SNMP trap

Trap 是一种由被监控设备上的代理在设备发生故障/网络问题时发送给 SNMP 管理器的加密消息。SNMP 管理器(监控服务器)会将 trap 转换为告警以通知用户。简而言之,当被监控设备出现问题时,会立即发送一个 trap。

例如,假设一台打印机通过 OpManager(SNMP 管理器)使用其 SNMP 监控 功能进行远程监控。当发生错误(如卡纸问题)时,打印机会立即生成一个 trap 并发送到 OpManager,OpManager 再将其转换为告警以通知用户。

为什么需要处理 trap

Trap 中的数据以对象标识符(OID)和值对的形式存在,每个值对称为一个 变量绑定(varbind)。接收到的 trap 是非人类可读格式,我们需要处理 trap,将这些信息转换为有意义、可读的数据。

与每个 trap 关联的 OID 值是唯一的。这意味着每个被监控的指标(例如:卡纸、门打开)都会拥有不同的 OID 以便区分不同的 trap。

OpManager 中 trap 如何转换为告警

在 OpManager 的 SNMP trap 监视器 中接收到的有关故障/网络问题/阈值违例的 trap,将被转换为告警以通知 IT 管理员。

OpManager 中的 SNMP trap 处理:Trap 流程图

在添加 Trap 处理器时,用户可以定义匹配条件(Match Criteria)。匹配条件定义 varbind 的值,如果这些值与传入 trap OID 中的数据匹配,则会触发一个告警。该告警通常称为 Trap 告警

重置条件(Rearm criteria)用于清除告警。当传入 trap OID 的 varbind 值与重置条件匹配时,该告警会被清除。

导航到 Alarms --> Trap Alarms 来查看各设备的 trap 告警列表。

前置条件

为了在 OpManager 中接收和处理 trap,用户需要在被监控设备上将安装了 OpManager 的服务器配置为 trap 目的地址。

处理 trap 的基础配置

在处理 trap 之前,用户需要在 OpManager 中启用 trap 处理并完成基础配置。

  • 导航到 Settings --> Monitoring --> SNMP Trap Processors
  • 点击 Trap Settings
  • 启用 trap 处理。(默认情况下,trap 处理是禁用的。)
  • 输入合适的 Trap 端口。(注意:Trap 将在此端口接收,请确保该端口未被阻塞。)
  • 为“Limit the SNMP Trap by failure component”输入值。该选项允许你基于告警实体限制 trap 的数量。
  • 为“Limit the trap by devices”输入值。该选项允许你基于设备限制 trap 的数量。
  • 选择类别,以筛选出需要应用此配置的设备集合。
  • 从“Available Devices”中选择设备,并将其移动到“Selected Devices”列。
  • 最后点击 Save 进行更新。

OpManager 中的 SNMP trap 处理:SNMP trap 设置页面

注意:“Limit SNMP traps by failure component”和“Limit traps by devices”的最大值为 5000。

OpManager 中的 Trap 处理

用户可以使用 OpManager 从终端设备接收 trap,并通过三种不同方式进行处理。

  1. 使用 Trap Viewer 实时查看传入的 trap。你可以为所有接收到的 trap 添加 trap 处理器,也可以只为希望触发告警的 trap 添加。
  2. 可以直接访问管理信息库(MIB),并将接收到的 trap OID 转换为可读形式
  3. 如果你已了解 OID 和 trap 参数,则可以直接根据下面的步骤为该 trap 添加处理器

从 MIB 加载 Trap 解析器

从不同 MIB 中加载 trap 的步骤如下:

  • 进入 Settings → Monitoring → SNMP Trap Processors。此处会列出所有已配置的处理器。
  • 将光标悬停在 Actions 菜单上,点击 Load Traps From Mibs
  • 在 MIB 列表中选择你要从中加载的 MIB,该 MIB 中的 trap 会被列出。
  • 选择所需的 trap 变量,点击 Add

系统会添加一个用于所选 trap 的处理器,并将其列出。

如何添加 trap 处理器?

1. 导航到 Settings--> Monitoring --> SNMP Trap Processors。将光标悬停在 Actions 选项卡上并点击 Add

OpManager 中的 SNMP trap 处理:添加 trap 处理器详情

2. 选择 SNMP 版本——SNMP v1/ SNMP v2c/v3,并输入名称和描述。

注意:当你使用 SNMP v3 监控设备并接收 trap 时,请确保用于设备监控和 trap 的凭据一致。

3. 如果选择 SNMP v1,请从下拉列表中选择通用类型(Generic Type)。OpManager 对 SNMP v1 支持以下几种 trap 类型:

  • coldStart:代理在配置被更改后重新初始化。
  • warmStart:代理在配置不变的情况下重新初始化。
  • linkUp:当代理上的网络接口卡(NIC)处于工作状态时。
  • linkDown:当代理上的网络接口卡发生故障时。
  • authenticationFailure:当 SNMP 代理收到来自未识别团体名的请求时发生。
  • egpNeighborLoss:代理无法与其 EGP(外部网关协议)对等体通信。
  • enterpriseSpecific:根据厂商而异,指定与特定厂商相关的错误条件和错误代码。

4. 输入 Trap OID(监控参数)以及该 trap 对应告警的严重性

5. 输入 Failure Component(故障组件)详情。故障组件表示在源设备中被监控的指标,用于限制 trap 处理器的数量。例如,OpManager 监控远程设备的 CPU 利用率和风扇状态,设备上的代理会发送一个 CPU 高利用率的 trap 和另一个风扇故障状态的 trap。由于这两个 trap 都来自同一源设备,OpManager 会将这两个 trap 合并并视为单一实体,以限制 trap 处理器的数量。

6. 输入 Source,即接收 trap 的设备。Trap 告警将关联到该设备。

7. 输入消息(Message)。Message 字段中的内容是为创建的 trap 告警提供的描述。

8. 选择匹配条件(Match Criteria)协议——AND/OR。然后选择 Varbind 数量并输入对应的匹配值。只有当该值与传入 trap 中的值匹配时才会生成告警。以同样的方式输入重置条件(Rearm Criteria)的详细信息。当接收到的 trap 的 varbind 值与为重置条件配置的 varbind 值匹配时,为该 trap 触发的告警将被清除。

注意:为避免性能下降,建议仅为选定设备配置和接收 trap。

处理 trap 告警

对于因 trap 触发的告警,你可以执行以下操作:

  • 配置通知配置文件(Notification profile)
  • 执行工作流
  • 升级告警

通知配置文件(Notification Profile)

OpManager 中的 通知配置文件 提供多种选项来处理告警。它主要用于通过邮件/SMS 将告警详情发送给 IT 管理员,也可以用于执行其他操作,如记录工单或运行程序。这有助于 IT 管理员远程监控设备并接收网络问题通知。

借助适用于 iOS 和 Android 用户的 OpManager 移动application,远程网络监控变得更加简单。通过该应用,你可以即时收到设备宕机状态、故障及其他性能下降问题的推送通知,从而不会错过任何告警。

执行工作流

你可以在 trap 告警上执行已保存的工作流。例如,你可以将关键的 trap 告警作为工单在 desk application(如 ServiceDesk PlusServiceNow)中创建,以便快速整改故障。

升级告警

对于每个已触发的告警,你可以执行以下操作:确认、取消确认、清除和删除。

但当 IT 管理员长时间未处理某个告警时,可以通过配置 告警升级规则 来升级该更新,并通过 SMS 和邮件将未处理告警的详情发送给相关团队成员。

感谢您的反馈!

此内容对您有帮助吗?

很抱歉给您带来不便。请帮助我们改进此页面。

我们该如何改进此页面?
您是否需要有关此主题的协助?
点击“提交”,即表示您同意根据隐私政策处理个人数据。