公司新闻

OpManager引领智能运维未来的发展方向

近年来运维技术飞速发展,运维团队大多建设好了各种系统,虚拟化、容器化、持续集成等。但是如何有效的利用这些系统最终实现站点的高可用、高性能、高可扩展?随着智能化技术的发展,为了解决上述运维领域的问题,智能运维的呼声已经越来越高。

如今,我们国家智能运维发展还是处于一个探索阶段,要想尽快在智能运维领域有所突破,首先要主抓好网络监视系统与网络警报系统,并利用机器学习算法进行快速网络监视与排障。

现在我们国家运维界在自动化方面已经达到了一定的水平,现阶段而且言,自动化与网络监视两部分还是是有一定距离。例如,你拿到了网络监视的报警,可能不清楚立马去做哪一项自动化的部署。如果能把自动化与网络监视这两部分有机的结合起来,运维的工作会运转的更加顺利。

在 PC 端的时代,运维的很多工作受限于浏览器,IT管理员拿不到用户端真实的数据。这种状况下,大家会普遍采购第三方服务,尝试获取终端数据。而且在移动端时期,我们都有自己的 IP,可以把采点的逻辑放在自己的 IP 里,然后获取到更准确、更真实的客户数据。相对于挑战来说,这其实是移动端带来的好处。

云服务的出现给运维工作带来难题。没有出现云服务之前,IT管理员在一台或是两三台机器中可以完成问题排查。出现云服务之后,这些问题可能拆到了好几十个分布式的地方,各自的输出,甚至启停会很方便,你有可能遇到在找问题的时候混淆的情况。而且解决这些麻烦是需要智能运维。

智能运维的理想状态是把运维工作的三大部分:网络监视、管理与故障定位,利用机器学习算法的方法把它们有机结合起来。

大家会朝着智能运维方向发展,并且智能运维的发展一定是一个长期演进的过程。第一步是智能运维在网络警报系统上的价值,第二步是智能地去判断网络警报,而且不是现在靠人力的经验去设定一个阈值。设定网络警报阈值是一项耗时耗力的工作,需要IT管理员在充分了解业务的前提下才能进行,还是得考虑业务是不是平稳发展状态。第三步是利用 NLP,把故障报告、文本化的语言提炼出来去自动反馈到这个系统里。这一点可能是更遥远的一个设想,但是如今来看会是将来发展的一条道路。我们也会确保OpManager在这条道路上始终保持领先前行!

 

推荐阅读:

1.如何使用网络拓扑管理IT?

2.如何使用端口扫描工具?