公司新闻

医院IT运维集中监控系统案例

西安电力医院是原西北电力集团医院所辖的一所综合性医院,现隶属陕西省电力医院。主要承担着陕西电力系统7万余名职工家属及胡家庙周边地区居民的医疗、预防、保健、急救等任务。医院是陕西省机关事业单位医疗保险定点机构,承担陕西省社会保险定点工作。是中国人寿保险医院定点医疗机构,承担陕西省商业医疗保险定点医疗工作。医院1983年筹建,1989年元月正式开诊。目前开设病床465张,25个医疗、医技科室,38个医疗专业。各类人员430名,其中高级职称56名,中级职称105人,初级职称126人。1993年在西安市首家通过国家卫生部“二级甲等医院”的评审。医院是西京医院、陕西省高等医学专科学校教学医院。

 

项目背景

西安电力医院的基础IT建设已具备了相当的规模,在基础设施建设、信息技术应用等方面取得了较好的成绩。近年来,医院在信息化管理方面做了大量的基础工作,引进了一些先进的管理理念,进行了许多有益的研究和探索,收到了一定的成效。这些为医院信息化建设的深入开展奠定了基础,是医院信息化建设科学管理的坚实基础。

但网络中心作为医院的基础网络运维部门和信息化建设的直接部门如何在网络管理方面的体现其价值地位,如何有效发挥其统一规划、统一协调和统一实施的关键作用;如何实现全面基础网络环境监管,形成集中管理,故障快速定位和排查,医院底层网络设备故障、各类医疗信息系统以及数据存储设备;是医院网络管理人员急迫需要解决的问题。

西安电力医院需要建立起IT运维管理体系;明确可量化、可操作的网络质量指标;快速准确的发现故障并告警,提高应用可用性与服务质量;规范网络运行维护流程,根据西安电力医院的实际需要,在网管系统中实现对其运维流程的支持;提高网络可用性与服务质量;实现端到端信息采集。

 

需求分析

西安电力医院现目前的网络基础规模已经非常完善,当同时伴随各种信息化系统的上线运行,越来越多的网络设备、服务器、数据库和软件中间件、存储设备等都需要进行统一监控,对系统故障的管理系统流程化管理模式。

现目前医院产品选型如下:

A. 部署卓豪OPManager标准版网络管理系统。

B. 部署卓豪Applications Manager应用监控管理系统。

C. 部署卓豪OPstor存储管理系统

 

将西安电力医院基础架构下述组件纳入监控对象:

l 网络设备对象。主要包括交换机、路由器、服务器等,通过标准管理接口及协议,采集状态信息。

l 可视化并解决switch/router问题。监控路由器和接口,带宽,WAN链路的可用性和性能。

l 拓扑管理。形成统一的运维拓扑图,实时展现设备状态及连接状态。

l 形成多样式的报表来展现设备的运行状态。

l 应用服务管理监控。对不同的业务系统、应用和网络服务(如服务器、操作系统、数据库、Web服务、中间件、邮件系统、其他关键应用等)进行多角度、深层次、更清晰地远程监控和管理。

l 存储设备。OpStor能够实时监控核心存储设备,如RAID、磁带库和磁盘驱动器,分析存储设备的状态和可用性,当设备状态变化时生成告警通知,并提供详细的报表。

D. 监控对象按照业务试图形成相应的人员权限,不同人员查看专属的设备及告警信息。

 

前期实施规划

1.1. 实施拓扑结构图

1.2. 实施说明

A. OpManager主要对设备的性能及状态进行管理。

B. 拓扑图展现医院所有的连接状态及链路状态。

C. Applications Manager实现所有医院应用系统的组件监控。

D. 存储模块;分析存储设备的状态和可用性,当设备状态变化时生成告警通知,并提供详细的报表。

1.3. 项目目标

通过医院统一建立IT运维管理监测平台,将医院相关应用及设备纳入其中,实现医院网络管理监控,实时了解医院整体网络应用运行状态,预测分析网络运行质量,监控单位内部网络运行状态,掌握网络运行情况,快速判断、追踪定位并响应网络故障。最终实现以下目标:

建设全面的监控管理平台,消除监控死角

以网络可用性监控为主线,构建全覆盖的网络监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成 IT 运维管理主动服务的新局面。

建设高效的应用监控平台,快速定位故障

快速搜索设备,高效定位故障点,及时故障告警,灵活告警机制让管理人员第一时间掌握故障信息,迅速作出响应,快速恢复系统运行。建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

变被动管理为主动管理

改变医院传统管理的被动局面,随时掌握局域网运行情况,在正常生产受影响前,及时将故障排除,提供安全高效的网络环境。

随时监控,消除人为隐患

应用调整的实时监控和审批机制有效约束人为配置修改造成的故障率,配置及时备份减少回退造成的事件延误。

解决方案设计

西安电力医院经过比较,最终采用了ZOHO的IT运维解决方案。

ZOHO的IT运维解决方案将各种管理功能整合到一起,统一地对网络、服务器、存储进行监控,充分体现了ZOHO服务管理的可视化、可控化和自动化。所有的管理功能采用Web 界面提供用户的访问,并定制针对不同人员的不同管理信息和界面。

用户投资回报

通过Web访问的基于角色的视图提供宝贵信息。ZOHO的IT运维解决方案提供网络运行状态全局监控视图,帮助中高层管理人员快速获得实时应用网络状态以及故障热点区域,协助其进行相关决策。同时提供分类的运维监控视图,帮助运维人员最快速最准确的获得网络状态信息以及详细细节,更高效的履行运维职责,缩短故障发现和故障处理时间,保障网络高可用性。

快速故障发现。ZOHO的IT运维解决方案提供自动重复事件压缩和关联分析,不仅使西安电力医院能获得所有已有的和潜在的故障信息,还保障其不至于被每日高达数以万计的事件信息所淹没。ZOHO的IT运维解决方案让其从纷繁复杂的信息中,找到那些对网络和业务正常运行有影响的故障信息并快速处理。

提高管理人员效率。ZOHO的IT运维解决方案所提供的清晰和积极的运维监控环境可以激励运维人员能够更高效的完成运维工作。经过系统一系列的智能分析,它不仅仅是告诉运维管理人员某个路由器的端口宕,它同时告诉运维人员,受影响的线路对端是谁,线路的中断可能影响到的IT业务有哪些。

 提高网络分析能力。ZOHO的IT运维解决方案能够帮助各级管理人员了解到现在的网络运行状态以及未来趋势,从而支持管理人员对网络的优化改造提供决策依据。保证网络的规划和建设在科学的数据分析的基础上进行,并保持与建设目标的一致性和投资的有效性。

ZOHO的IT运维解决方案优势

1. 实现基础监控。包括所涉范围内各种网络设备、服务器、应用系统、存储、光纤交换机等实现全面的监控管理。

2. 建立主动和预警管理体系。根据西安电力医院的需求对网络事件进行采集、分类、处理和呈现,以实现对网络状况的及时、高效、准确了解;这种监控能够实现主动处理和预警功能,从而奠定服务质量管理的基础。

3. 规范运行操作流程。在网络管理解决方案中,以网络故障事件处理为核心,确定网络运行操作岗位的设置和职责,实现网络故障处理的记录、升级、统计、审计。

4.针对重要程度不同的管理对象,实现精细化管理。对不同的业务和管理对象可以配置不同的告警级别、响应操作等,使运维管理人员可以集中精力优先处理对业务支持产生重大影响的故障。