公司新闻

IT帮助台核心KPI系列1:服务中断损失

IT帮助台KPI系列

随着IT帮助台软件报告功能的发展,

现在可以测量和监控的帮助台KPI和指标多达数百个。

但是,应该衡量什么?怎么才能确切地衡量?

不是所有的帮助台指标都需要衡量,

您应该衡量对您IT帮助台至关重要的指标,并改进提供的服务。

后续的该系列文章中,

我们会分别介绍IT帮助台至关重要的几个KPI。

如果您对某个帮助台指标感兴趣,可发送至公众号,

我们将在后续的文章中介绍您感兴趣的指标。

KPI指标

服务中断损失

定义:由于IT帮助台不可用而导致业务中断的小时数。

目标:尽量把服务中断损失降到最低限度。

大部分IT团队通过跟踪服务可用性,来查看IT帮助台的总体性能。但服务中断损失并不总是反映在服务可用性级别上,即使这些级别很高。例如,如果服务可用性为99.9%,公司每年仍然会有8小时以上的服务中断损失。追踪服务中断损失可以突出损失及其对业务的影响。

 

案例:Virgin Blue 停飞故障

2010年9月,Virgin Blue遇到了对于航空公司来说噩梦般的情况。大约5万名顾客100个航班停飞。由于托管Virgin Blue应用程序的固态磁盘服务器基础设施出现故障,在接下来的几天里,又有400多个航班被推迟或重新安排。这影响了Virgin Blue的在线登记和预订系统。

尽管SLA要求立即恢复服务,但恢复服务需要11个小时,而完全恢复操作则需要10个小时。因为,试图修复一个有故障的设备,延迟了切换到应急硬件平台的时间。到那时,已经造成了破坏。尽管这11个小时在Virgin Blue的服务可用性方面花费不多,但业务损失方面,Virgin Blue损失了约1000万美元。

行业标准 - 服务中断损失

服务中断损失

减少服务中断损失的技巧

正确规划和执行应用程序升级、服务器迁移和任何IT更改实施过程。

有一个简洁且定义良好的CMDB来识别重要的故障点,并了解网络中的CI交互,以识别变更失败带来的级联影响。

加强IT团队在营业时间和收入方面违反SLA的风险教育。

通过评估IT帮助台过去的表现,深入了解如何预测和处理停机。

也就是说,很多因素都会对服务中断损失产生负面影响。在2010年Gartner就表示,“影响关键业务服务的停机中,80%由人员和流程问题造成,而超过50%的停机由更改/配置/发布集成以及移交问题造成。”