服务器负载说明

最后更新:2017-03-03

 

这篇将详细说明OpManager的负载产生的主要原因,后面是探针数量的计算方法。

 

A. 软件许可计算

可以使用IP地址ping通的一个设备,例如路由器、交换机、服务器或其他设备。OpManager的软件许可数就是其监视的设备数。一个独立的OpManager服务器最多可监视1000个设备。

 

说明
软件许可不计接口数,你可以监视接口的可用性、健康状态和流量。但是监视太多的接口会影响系统的性能。一个独立的OpManager服务器不能监视多于10000个SNMP接口。如果你使用ICMP ping监视接口,可监控数量将大幅下降。根据ping的情况和其他网络因素,一个独立OpManager服务器可监视2000-5000个接口。

B. 轮询间隔

默认情况下,服务器CPU的监视间隔是5分钟,磁盘是30分钟。类似的,接口的性能参数监视间隔是15分钟。上面提到的监视数量是基于默认的监视间隔计算的。

 

说明
如果把轮询间隔从5分钟改成1分钟,那么服务器的负载将增加5倍。如果你有1000个服务器的监视间隔都是1分钟,那么你要5台OpManager探针服务器。
 

 

 

C. 协议

使用WMI和SNMP监视一个设备是不同的。不同的协议都可用于批量监视。上面A的数量是基于SNMP计算的,但是如果你使用WMI、CLI、VMware API、Xen API、UCS API等进行监视,这些数量要相应减少一些。

 

说明
监视1000个SNMP服务器和监视1000个Vmware服务器的负载差距很大,如果你不使用SNMP的话,A中的数量要相应减少1半。

 

 

D. 性能监视器

一般的,OpManager对每个网络设备监视10-15个性能参数,对服务器和应用监视20-30个性能参数。A中的计算是基于这种基本监视数量,如果你要监视更多参数,你要使用更多的OpManager探针服务器。

 

说明
例如,1000个设备,每个设备监视10个参数,轮询间隔是15分钟,那么如果你要把监视参数的数量增加为每个设备20个,那么服务器负载自然会翻倍。
 

 

E. 陷阱

OpManager自动处理接收自网络设备和服务器的陷阱。如果你的网络中产生了大量的陷阱,OpManager的负载就会增加。你可以找到陷阱源并停止发送陷阱。或者你需要在OpManager解析这些陷阱并生成告警,这样的话,你就应该考虑增加OpManager探针服务器。

 

说明
1000个设备偶尔发生几个陷阱,服务器是可以正常处理的。但是如果1个设备连续爆发成百上千个陷阱,OpManager就要投入大量的资源来处理这些陷阱,可能会影响正常的监视任务。
 

 

F. Netflow监听

Netflow是基于接口数量计算软件许可数的。每个发送Netflow的接口占用一个许可数量。一个独立的NFA服务器可以处理多达每秒10万个流包;最多可以支持5000个接口。

 

说明
当你从路由器、交换机、防火墙输出流包到OpManager服务器,接口就会自动添加。如果你不想管理一些接口,你可以选择接口并改为“不管理”或者删除,这样就不会占用许可数量。
 

 

说明

你也添加带有NFA模块的OpManager探针,

或者直接使用NFA的分布式版本。

 

G. 每秒流包数(FPS)

一个独立的服务器可以处理每秒10万个流包。如果你要处理更多流包,你要增加探针服务器。

 

说明
1000个接口,每个接口每秒发送50个流包,那么就是每秒5万个流包发送到OpManager。但是,如果几个核心接口每秒发10万个包,那么你就要增加探针了。

 

 

H. DNS搜索

默认情况下,在页面中的报表使用IP地址,如果你要显示IP地址对应的域名,要启用“域名解析”选项。这也会很大程度的影响到性能。每处理一个包都要解析域名。OpManager会缓存50000条域名记录,即使如此,还会产生几秒到延迟。

 

说明

在不解析域名的情况下,一个OpManager服务器可以处理1000接口每秒10万的流包。

但是:

如果要解析域名,要多用1秒来进行DNS搜索,这样对这1000个接口,要使用2个探针服务器。

 

I. 网络配置管理(NCM)的软件许可计算

NCM按要备份配置或管理的设备数量计算许可的。默认情况下,OpManager服务器可以管理多达5000个设备。每一个网络设备(路由器、交换机、负载均衡)可执行的配置管理任务包括:接收配置变更告警、备份配置、执行配置命令、生成合规性报表。

 

J. NCM备份间隔

默认每24小时备份一次。I就是基于此计算的。如果你要减少备份间隔,会影响到性能,如果达到可管理设备数量上限,就要增加探针服务器。

 

说明

5000个设备的每天备份负载和200个设备每小时备份的负载是一样的。

这样的话,你要增加备份频率,就要添加更多的探针服务器。
 

K. 防火墙管理(FWA)软件许可计算

每个防火墙设备占用一个Firewall Analyzer(FWA)许可数。

 

L. 每秒防火墙日志数(LPS) 

一个服务器默认可以处理每秒2000条日志。依此计算探针的数量。

 

说明

例如,如果每个防火墙每秒发送40条日志,一个服务器可以处理50个防火墙。

但是一个服务器不能处理1个防火墙每秒发送3000条日志。那样你要分散负载。

M. 应用管理插件(APM)许可计算

APM按照监视器数量计算许可,一个服务器、一个URL、一个文件/目录监视算做一个监视器。一个独立的APM插件可以管理多达500个监视器。

 

说明

例如,对用一个安装了IIS的服务器,你既要监视IIS,又要监视服务器,那么50个这样的服务器就占用100个许可数。

 

N. 应用管理插件(APM)轮询间隔

M是基于APM默认的监视间隔计算的。如果你要增加监视的频率,就要增加探针。

 

说明

你可以安装多个APM插件(即在多个OpManager探针上安装APM插件),或者你可以使用APM的企业版进行分布式部署。

 

 

如何计算你需要的探针数量

下表是上面影响因素的汇总,安装各种情况的影响因素计算探针数量。

 

  每服务器最大支持数 影响因素
监视(设备) 1000 B/C/D/E 
监视(接口) 10,000 B/C/D/E
Netflow(接口) 1000 G/H
NCM(设备) 5000 J
防火墙(设备) 50 L
APM插件(监视器) 500 N