故障转移或者热备,让OpManager提供了不间断服务。可以防止因为数据库宕机、网络中断等意外事故导致OpManager监视中断。常规的数据库备份在故障发生后恢复数据要花费大量的时间,并且你的网络会失去OpManager的管理。必然会影响到你的业务。热备可以帮助你避免这样的情况发生。
故障转移的热备方式就是安装OpManager的备用服务器,保存和主服务器的心跳连接。一旦主服务器出现故障,备用服务器将自动接管主服务器并开始监视网络。通过这样平滑的过度,不会使OpManager管理中断,甚至用户都感觉不到主服务器故障。备用服务器接管后发送邮件告警(参考邮件服务器设置部分)。当主服务器恢复后,备用服务器也恢复备用状态。
工作机制
主服务器每一段时间在BEFailover表中更新自己的状态计数,这段时间间隔就是HEART_BEAT_INTERVAL(心跳间隔),状态计数不断增长,称为LASTCOUNT(最后计数)。相应地,备用服务器也再更新其状态计数。
如果主服务器出现故障后,就不会更新LASTCOUNT,备用服务器通过一定时间间隔(FAIL_OVER_INTERVAL)监视主服务器的LASTCOUNT。默认FAIL_OVER_INTERVAL值为60秒。如果需要,同编辑Failover.xml file (
安装主服务器
在安装OpManager的时候,向导出现选择服务器类型页面,选择单独安装或者主服务器。
安装备用服务器
| 注意:主服务器和备用服务器的系统时间要同步。 |
热备配置
更加不同的后台数据库,配置热备的说明如下:(目前只支持MSSQL集群,其他数据将会在以后版本中支持)
如过你的OpManager使用MS SQL作为后台数据库,MS SQL部署在集群上。集群就是一组数据库使用一个虚拟IP提供服务,如果这组数据库之一出现问题,其他数据库提供数据的高可用性。OpManager使用数据库集群,当主服务器宕机后,备用服务器接管服务连接到数据库集群的虚拟IP地址。
关于配置MSSQL数据库集群的详细信息,请参考:
http://www.microsoft.com/technet/prodtechnol/sql/2000/maintain/failclus.mspx#EDAAC
对于MSSQL,备用服务器可以在安装后立即启动。
当主服务器出现故障后,备用服务器接管网络管理。当主服务器恢复正常后,备用服务器恢复备用状态,监视主服务器状态。