成功案例

ManageEngine助力海南航空IT运维管理水平腾飞

用户概况

作为中国成长速度最快的民航企业之一,海航集团在信息化上也是航空业最具远见的领袖企业。随着信息化的信息化建设的大力推进,海南航空已经拥有规模庞大的数据中心以及十分先进的业务应用系统,保证数据中心IT系统稳定、高效运行,成为摆在海航集团系统运维部门面前的一个严峻课题。

面临问题

海航集团信息系统运维工程师靠每天手工登录各个服务器以输入命令的方式检查系统,处理来自用户的故障及问题来保障系统的正常运行,人员各自负责一项维护内容,需要问题相关人员一起分析处理,随着系统出现问题越来越多,工程师感觉工作不堪重负,压力越来越大。

总结当前信息系统运维管理面临的主要挑战有:
1.日常信息系统运维管理处于救火方式,无反应则无法第一时间发现系统问题;
2.业务系统重要程度日益提升,现有的维护方式无法保证业务系统持续稳定运行,没有行之有效的系统性能及问题分析手段;
3.系统复杂度越来越高,对运维人员需要掌握知识范围及深度也越来越高,一个系统问题,往往需要多个维护人员共同分析处理才能解决,部分经常出现的问题也不能得到有效的根治;
4.业务系统数量逐步增加,IT设备也随之增长,现有设备情况没有人完全掌握,对已有设备没有完善管理方式,比较老旧的设备,也没有人清楚归谁管理;
5.工程师日常操作均采用远程登录方式,网络设备的配置修改,系统软件的变更出现问题,往往不会及时显现问题,但问题发生时影响却可能很严重;
6.工程师各自忙于个人工作,管理人员忙于协调人员救火,用户一直抱怨系统经常出现问题,运维部门解决不利。

解决方案

经过对比和测试国际流行的IT运维管理解决方案,海南航空最终确定选择以卓豪ManageEngine网络管理系统(OpManager)、应用性能监控系统(Application Manager)和存储网络管理系统(Opstor)三款产品为基础,构建海南航空整体IT运维管理平台。

网络故障监控
作为整个IT系统的基础,其可用性时要优先保障的,海南航空采用OpManager网络管理模块来实现此目标。通过OpManager的实时监控功能对每个设备的详细性能进行轮询采集,并实时存储于后台数据库,管理人员可随时对每个设备的运行状况和性能进行实时查看,及时把握异常及性能下降的情况。通过OpManager直观的网络视图、自定义视图等展示功能,将实际网络运行情况、各设备状态、线路状态及流量等信息,实施展现在监控屏幕上,供所有管理人员进行随时查看。另外,通过手机短信等手段,将各种告警、事件等及时通知给各相关人员,事先快速故障响应、快速定位及快速故障排除,协助管理人员高效率的管理网络基础架构。

应用性能监控
对于中心更为重视的服务器群的管理,采用Applications Manager应用服务管理模块。通过直观的业务视图将服务器按业务进行分组展示,并以图形化的方式进行展示,同时投放到监控屏幕,由专业监控人员实施监视,确保问题发生的同时,即可有专业人员发现并进行处理,同时结合短信的手段实现快速的发现及通知机制,以保证监控工作没有疏漏。借助于系统丰富的监控功能,可对各个服务器及数据库、Web服务等应用的详细性能进行监视,实现了性能级别的趋势掌握以及事前管理等目标。利用后台继承的数据库进行性能数据存储,并通过数十种默认及自定制的报表进行系统历史运行情况的汇总及报告,协助管理人员有效的进行长期规划和工作总结等。

存储网络管理
利用OpStor全面监控后台的存储网络,将海航数据中心中的光线交换机、磁盘阵列、磁带库等存储网络元素置于统一的管理平台中,并对诸如可用性、健康状况、接口详情、Raid的磁盘详情、分卷信息、控制器信息等实现实时的监视。完全保证了管理人员对于后台存储网络的实时管理,确保了整个存储网络的正常运转。

客户受益

通过IT运维管理平台项目的建设,实现了项目的整体预期,解决了信息系统面临的多种运维管理问题,达到了建设目标,将国际先进的运维经验应用在海航集团系统实际运维工作中,实现了运维管理水平的整体腾飞。