AlarmsOne解决方案案例

 

 

北京昆仑联通科技发展股份有限公司统一告警平台解决方案分享

客户背景

北京昆仑联通科技发展股份有限公司创立于1998年,昆仑联通 深耕IT服务23年,公司业务由总部北京向全国辐射,在上海、 深圳、苏州、南京设有分公司,生态伙伴1000余家,产品服务 5000余项,服务企业用户超20000家,作为一家全周期一站式 IT运营服务商,他们以专业的水准和20余年的行业头部用户技 术积淀,为客户提供咨询规划、技术落地、运营优化,形成了 从IT基础架构平台设计、安全体系建设咨询、业务连续性规划咨 询、IT运营服务管理的层次化IT服务格局,大幅降低客户选择成 本、降本增效,加速转型,助力IT驱动业务快速发展。

 

面临问题

每个昆仑联通的子用户都有各自复杂的IT环境,在子用户的环境中无论数据中心管理团队、网络运维团队还是开发团队通常 使用不同的工具,这些工具会产生海量的告警信息。如何汇集所有告警,深入分析每一个重要的告警,最小化系统宕机时 间是昆仑联通公司为子用户提供服务之一,所以本项目的目的是帮助昆仑联通为他的子用户实现以下功能:

1. 把昆仑联通公司目前涉及到的所有监控平台的告警统一集成对接到一个SaaS化平台打通各领域监控告警信息孤岛问题;

2. 统一智能告警平台能对集成对接进来的告警事件进行去重以及智能降噪压缩优化;

3. 对各领域告警事件统一制定精准灵活的分派策略以及覆盖多种灵活的通知方式和灵活的问题升级功能等;

4. 遵循ITIL事件管理流程以及SLA机制,实现每一个告警事件单的闭环;

5. 对子公司各领域的告警事件提供多维度的分析报表输出功能。

 

解决方案

昆仑联通公司经过产品比较分析,最终采用了ManageEngine卓豪的统一告警平台(AlarmsOne)。汇集所有告警 于一个平台,运维人员可以深入分析每一个重要的告警,根据需要打开、确认、关闭和删除警报。根据严重性、应用 程序、类别或显示名称对警报进行分组。以及警报升级,当昆仑联通的值班人员未能确认或关闭警报时,及时通知另 一名技术人员处理等功能。

1. 管理不同地点的告警:昆仑联通借助于告警采集器,实现上海、北京、南京等不同地点客户的告警的统一管 理。下图为部分支持的告警采集器程序,对于云监控工具,可通过WebHook或者邮件等方式将告警传送到 统一告警平台(AlarmsOne)上;

实时告警:昆仑联通可以实时从统一告警平台获取告警信息并第一时间通过短信、邮件或电话呼叫通知系统 管理员,有助于快速执行处理行为;

智能分类过滤与降噪:统一告警平台智能地根据不同客户的主机、网络设备、应用、数据库等对告警进行分 类,关注影响重大的告警,缩短告警识别和问题根源分析的时间。

 

客户受益

通过统一告警平台(AlarmsOne)收集并简化昆仑联通不同客户的不同应用的告警,并可识别警报并根据来源、严重性、应用程序 或主机对它们进行分组。帮助昆仑联通的技术人员快速识别和解决问题,从而轻松管理IT警报,让IT运维变得简单。

 

产品介绍

统一告警平台(AlarmsOne)是一个基于SaaS的告警管理平台,用于监控、跟踪和管理所有基础设施监控工具、云 监控服务、日志分析系统以及项目管理软件产生的告警。包括ManageEngine, Solarwinds, HP, Zabbix, Nagios, Zenoss, PRTG, Appdynamics, 微软SCOM, New Relic, Loggly, JIRA等等。

在复杂的IT环境中,数据中心管理团队、网络运维团队以及开发团队通常使用不同的工具,这些工具会产生海量的告 警信息。统一告警平台(AlarmsOne)能够汇集所有告警,便于深入分析每一个重要的告警,从而最小化系统宕机 时间。