配置OpManager的热备系统

 

OpManager的热备支持是保证其无故障运行的必要条件。当OpManager出现数据库崩溃或者丢失网络连接等情况时就会无法正常工作,更不可能继续监控网络了。尽管定期的备份可以帮助您从故障中恢复数据,但是这还是会导致您在一段时间内无法使用OpManager服务。如果这期间内一些比较重要的设备比如路由器、邮件服务器等出现故障的话,给您的商业运营带来的影响将是不可估量的。为了解决这个问题,我们建议您部署一个热备系统。

 

热备系统需要您在保证OpManager主服务器正常工作的同时为OpManager准备一个备用服务器。一旦主服务器出现故障,备用服务器可以立刻接手监管工作。这个过渡过程非常的迅捷,用户是很难觉察到的。在过渡的同时备用服务器会发送一封关于主服务器故障的告警邮件给技术员(此技术员的电子邮件地址配置参看配置邮件服务器)。当主服务器恢复正常重新开始工作,将自动作为备用服务器,以备用模式进行运转。


工作机制

主服务器在规定的时间间隔内通过修改BEFailover表中的计数器来更新它的状态,这个时间间隔又称为心跳间隔(HEART_BEAT_INTERVAL)。这个计数又称最新计数(LASTCOUNT),它将不断地递增。同样的备用服务器也会通过修改BEFailover表中的LASTCOUNT值来更新其状态。


当主服务器发生故障时,它将无法更新LASTCOUNT的值。备用服务器会按照特定周期间隔(即FAIL_OVER_INTERVAL)轮询监视主服务器的LASTCOUNT值。默认FAIL_OVER_INTERVAL的值是60秒,如果需要的话你可以从Failover.xml<OpManager_Standby_home>\conf)文件中修改这个值。假如您已经指定了FAIL_OVER_INTERVAL 的值为50秒,那么备用服务器将会每隔50秒就访问一次主服务器的LASTCOUNT值。每次访问的时候,备用服务器都会将当前LASTCOUNT值和上一次访问时记录的LASTCOUNT值进行对比。当主服务器没有更新LASTCOUNT值,连续几次获取计数值相同的时候,备用服务器会认为主服务器已出现故障并开始接管主服务器的工作。


安装主服务器
请使用或升级至最新版本的OpManager,在安装向导中选择独立服务器或主服务器选项,安装完成后运行主服务器。

         

安装备用服务器

OpManager安装为备用服务器的时候:

  1. 在安装向导中选择备用服务器模式


  2. 输入配置主服务器的画面,请输入主服务器的设备名、端口、登录明细等,完成后先不要启动备用服务器



主服务器和备用服务器的数据和时间设置必须相同。

配置热备:

当前版本仅支持MSSQL数据库。

 

使用MSSQL作为后台数据库

如果你使用MSSQL作为OpManager的后台数据库,就需要执行群集。群集数据库可以理解为将数据存储在一组各自独立的数据库中但是只使用一个虚拟IP地址。如果群集环境中的任一数据库出现问题,其他的数据库可以代替它提供数据,因此群集数据库能够提供很高的数据可用性。主服务器将它所有的数据发送到此虚拟IP,群集数据库会将这些数据保存到多个位置。一旦主服务器出现故障的时候备用服务器开始接手工作,它也会将数据发送到此虚拟IP中。


更多关于配置MSSQL服务器群集访问信息请参考Microsoft官方介绍
http://www.microsoft.com/technet/prodtechnol/sql/2000/maintain/failclus.mspx#EDAAC


如果您已完成了主服务器的MSSQL群集配置的话,备用OpManager服务器可以直接连接到MSSQL数据库中,无需进行其他的配置便可启动。


一旦主服务器出现故障,备用服务器便开始接手主服务器的网络监控工作。当主服务器恢复正常的时候备用服务器会自动转换成备用模式并继续监视主服务器的状态。






Copyright © 2005-2013, ZOHO Corp.,All Rights Reserved.