下面的表格给出了各模块中每个探针可承受的最大负载汇总。每个探针的累计负载为类别 5、4、3、2 的总和加上类别 1 中的任意一项。类别 1 中不能叠加多于一项。
| 类别 | 每台Server最大值(列 1) | 影响列 1 的因素 | 所需探针数量 | |
|---|---|---|---|---|
| 1 | 监控(SNMPv3 设备) | 500 | B/C/D/E | 需基于第 2 列计算 |
| 1 | 监控(SNMPv1、v2 设备) | 1000 | B/C/D/E | " |
| 1 | 监控(Server WMI、CLI、VMware) | 1000 | B/C/D | " |
| 1 | 监控(接口) | 10,000 | B/C/D/E | " |
| 2 | Netflow(接口) | 8000 | G/I | " |
| 3 | NCM(设备) | 5000 | K | " |
| 4 | 防火墙(设备) | 50 | M | " |
| 5 | APM 插件(监视器) | 500 | O | " |
注意:OpManager 企业版在单次安装中最多支持 100 个探针或 10,000 台设备以及 50,000 个接口。如果您在管理多个站点,可以使用 OpManager 企业版从一个中心位置监控最多 100 个远程站点。使用 Enterprise Lite Central,可监控最多 30,000 台设备和 100,000 个接口。
现在,我们来了解 OpManager Server上负载(LOAD)的各个方面。
设备是通过 IP 地址可 Ping 通的路由器/交换机/Server或任意设备。OpManager 的授权基于其监控的设备数量。单台Server监控的设备数不能超过 1000 台。
| 注意 |
|---|
| 接口不计入授权。您可以监控接口,并对其可用性、性能和流量进行监视。但添加大量接口会影响系统性能。单台Server最多可处理 10,000 个 SNMP 接口。如果您使用 ICMP Ping 监控接口,则每台服务器可监控的接口数量会大幅下降。根据 Ping 性能及其他网络因素,每个探针可能只能监控 2000-5000 个接口。 |
默认情况下,Server的 CPU 每 5 分钟监控一次,而磁盘每 30 分钟监控一次。类似地,接口中某些参数每 15 分钟监控一次。以上在条款 A 中提到的可扩展性数据基于默认监控间隔。
| 注意 |
|---|
| 将设备轮询间隔从 5 分钟改为 1 分钟会使负载增加 5 倍。如果您有 1000 台希望每 1 分钟监控一次的Server,则需要 5 个探针,而不是仅仅 1 个。 |
通过 SNMP 监控设备与通过 WMI 监控同一设备是不同的。这些协议的特性决定了它们在大规模监控时的易用程度。条款 A 中列出的数据基于 SNMP。对于 WMI / CLI / VMware API / Xen API / UCS API 等其他协议,可扩展性数据会明显更低。
| 注意 |
|---|
| 在单台Server上监控 1000 台 SNMP Server与监控 1000 台 VMware Server并不相同。对于 SNMP 以外的协议,其可扩展性数据不同。 |
默认情况下,OpManager 每个网络设备采集大约 10—15 个参数,每台Server/应用采集大约 20—30 个参数。条款 A 中给出的数据基于默认监视器数量。如果您添加更多监视器,性能会受到影响,需要通过添加更多探针来分担负载。
| 注意 |
|---|
| 1000 台设备,在 15 分钟间隔下有 10 个监视器,与 1000 台设备在 15 分钟间隔下有 20 个监视器并不相同。后者会使负载增加一倍。 |
OpManager 会自动处理由网络设备和Server发送的 Trap。如果您的网络发送了大量 Trap,会影响性能。您可以识别 Trap 的来源并将其关闭;或者如果您需要这些 Trap,可以添加 Trap 处理器并将其转换为有意义的告警。后一种方式需要额外的探针来处理额外负载。
| 注意 |
|---|
| 1000 台设备、偶尔一两个 Trap,可由一台Server处理。但如果有 1 台设备持续产生上千条 Trap,OpManager 可能会将大量资源用于处理 Trap,从而影响正常监控。 |
Netflow 模块的授权基于接口数量。每个向 Netflow Server导出流的接口都视为一个授权单位。单台 NFA Server最多可处理每秒 100k 条流,且最多 5000 个接口。
| 注意 |
|---|
| 当您从路由器/交换机/防火墙向 OpManager Server导出流量时,这些接口会自动添加到系统中。如果您不希望处理某些接口,可以将其设置为“取消管理”(UNMANAGE),这样它们既不会被计入授权,也不会被处理;如果不需要,还可以直接删除。 |
| 注意 |
|---|
您可以增加更多带有 NFA 模块的 OPM 探针, 也可以采用独立的 NFA 分布式版本,其具有独立的中央和探针模型。 |
单台Server最多可处理每秒 100K 条流量。超过该值,则需要添加额外的探针。
| 注意 |
|---|
| 1000 个接口,每个接口 50 条每秒的流量,相当于在 OpManager 端每秒 50k 条流。但如果一两个核心接口每秒产生 100k 条流量,那么最好将负载拆分到多个探针上。 |
默认情况下,OpManager 的 NetFlow 模块中原始数据存储是关闭的。这意味着 OpManager 最多可处理每秒 200K 条流量。
当启用原始数据时,在启用 HighPerf 附加组件的前提下,OpManager 将可处理每秒 100K 条流量。
默认情况下,IP 地址会在报表和整个界面中按原样显示。如果您希望显示域名而非 IP 地址,则需要启用 ResolveDNS 选项。但启用后会严重影响性能。每次处理流量时都会进行查询。OpManager 会缓存最近 50,000 条记录的域名,但仍可能出现几秒钟的延迟。
| 注意 |
|---|
在不启用 DNS 查询的情况下,1000 个接口、每秒 100k 条流量可由一台Server处理。 但是, 若 1000 个接口、每秒 100k 条流量并启用 DNS 查询,而每次查询需要 1 秒,则必须拆分为两台探针来处理。 |
NCM 的授权基于需要备份或管理的设备数量。默认情况下,单台 OpManager Server最多可处理 5000 台设备。交换机、路由器或负载均衡器都被视为一个设备,无论您只是希望在配置发生变更时收到通知、进行备份、使用 configlet 进行配置下发,还是仅运行合规性报告,均按一个设备计算。
默认情况下,每 24 小时进行一次备份。条款 I 中提到的数量基于该间隔。如果您缩短间隔,将会影响性能,需要分担负载。
| 注意 |
|---|
5000 台设备、每天备份一次,与仅 200 台设备但每小时备份一次的负载相当!!! 因此,如需频繁备份,请增加更多探针并分担负载。 |
在防火墙分析器中,每个防火墙都会消耗一个授权。
默认情况下,单台Server最多可处理每秒 2000 条日志。超过该值则必须增加更多探针。
| 注意 |
|---|
50 台防火墙,每台每秒 40 条日志,可由一台Server处理。 但若 1 台防火墙每秒 3000 条日志,则无法由单台服务器处理,必须分担负载。 |
APM 的授权基于监视器数量。一台Server是一个监视器,一个 URL 是一个监视器,一个文件或文件夹也是一个监视器。单个 APM 插件在单次安装中建议最多使用 500 个监视器。
| 注意 |
|---|
50 台安装了 IIS 的Server,如果您希望同时监控操作系统和 IIS,将使用 100 个监视器。 如果您还希望监控所有 50 台Server上的 URL,则将使用 150 个监视器。 |
条款 M 中提到的数量仅适用于默认监控间隔。如果您希望更频繁地采集数据,则必须增加探针数量。
| 注意 |
|---|
您可以选择安装多个 APM 插件(每个探针一个),或者也可以选择独立的 APM 企业版。 |
感谢您的反馈!