LAMA:日志分析与应用程序监控

印度证券交易委员会(SEBI)近期引入了一项开创性的、基于API的日志记录与监控机制(LAMA)框架,旨在应对日益增长的、对股票经纪人数字交易系统技术故障的担忧。本文将深入探讨SEBI这一新的LAMA框架,包括其对技术故障的定义、合规的先决条件、股票经纪商在采纳过程中可能面临的潜在瓶颈,以及OpManager Plus如何帮助他们有效克服这些挑战并遵守SEBI的法规。

SEBI对技术故障的定义

根据SEBI的定义,技术故障指的是"股票经纪人系统内的任何故障,包括其硬件、软件、网络、流程或股票经纪人提供的任何产品或服务的故障"。这些故障可能由多种因素引发,例如基础设施不足、网络攻击、程序错误、流程故障或第三方系统问题。要被认定为技术故障,该故障必须导致股票经纪人系统的正常功能停止、放缓或异常,且持续时间达到五分钟或以上。

LAMA合规的先决条件与瓶颈

为有效遵守SEBI的LAMA框架,并避免因重复发生故障而面临潜在的经济处罚,股票经纪商需要在组织内实施以下监控与合规措施。

建立监控系统

股票经纪商需要一种监控工具,持续测量和监控其关键交易基础设施的关键参数,并且必须将监控数据发送给证券交易所。将监控系统与现有IT基础设施(尤其是当前系统并非为支持此类功能而设计时)进行集成,可能是一个巨大的挑战。

数据传输、报告与留存

股票经纪商需要在故障发生后的一小时内通知证券交易所。此外,应在不晚于下一个交易日(T+1)向交易所提交初步事件报告,其中需包含事件发生的日期时间、影响范围以及为解决该问题所采取的步骤。SEBI还指出,应进行根本原因分析以深入探究故障背后的原因。这份全面的分析报告必须在事件发生后14天内提交给证券交易所。持续满足这些报告义务可能具有挑战性,尤其是在交易高峰时段,此时工作重点通常在于保障平稳运营而非撰写报告。除此之外,存储和管理如此大量的数据可能非常耗费资源,股票经纪商可能需要投资于稳健的数据存储解决方案,而这在搭建阶段会耗费大量时间和资源。

容量规划

SEBI规定,"股票经纪商应为其整个交易基础设施(即服务器容量、网络可用性和交易应用程序的服务容量)进行容量规划。"此外,"已安装的容量应至少达到日历季度内观测到的峰值负载的1.5倍(1.5x)"。

业务连续性规划与灾备站点

根据SEBI的要求,"在交易所拥有最低客户数量的股票经纪商(具体数量可由证券交易所不时规定)必须强制建立业务连续性/灾难恢复设置",以确保在发生灾难时业务能够持续。但建立这些设施需要周密的规划、测试以及对冗余系统和基础设施的投资。对于一些股票经纪商来说,这可能涉及显著的成本和资源投入。有关这些规则的更多详细信息,请参阅SEBI 2022年11月25日的通告。此外,遵循LAMA协议可能要求股票经纪商分配额外的资源和投资来获取必要的工具和技术。规模较小的经纪公司或IT能力有限的公司可能会发现,投资于复杂的监控解决方案和灾备设置具有挑战性。

OpManager Plus如何助您遵循LAMA框架?

OpManager Plus 提供对网络资源的全面监控,包括峰值负载、服务器容量和网络带宽。通过监控这些参数,股票经纪商可以主动评估其基础设施的容量并识别潜在的瓶颈。此外,当发生技术故障时,该软件可以通过分析相关事件和数据,迅速找出根本原因。根本原因分析后,股票经纪商可以采取及时、有针对性的行动来解决问题,从而减少停机时间并最大限度地降低对交易系统的影响。

OpManager Plus 内置了LAMA功能,允许证券交易所按照SEBI的规定监控关键系统的关键参数。OpManager Plus 为以下参数提供深入的历史报告,帮助您保持对LAMA政策的合规性。

参数类别参数名称描述
应用监控参数日志监控监控系统日志和事件日志
每秒请求数应用程序的吞吐量
平均响应时间应用程序延迟(以微秒为单位)
交易 API 失败次数API 的失败次数
客户端认证失败次数客户端认证的失败次数
网络延迟网络延迟(以微秒为单位)
历史每秒请求数应用程序的历史吞吐量
历史平均响应时间应用程序的历史延迟(以微秒为单位)
硬件监控参数CPU 利用率CPU 使用率(百分比)
内存利用率内存使用率(百分比)
运行时间运行时间(以分钟为单位)
磁盘利用率磁盘空间使用率(百分比)
数据库监控参数复制状态正常 / 异常
复制队列大小队列规模
复制带宽利用率复制带宽使用率(百分比)
网络监控参数数据包错误数数据包错误的数量
带宽利用率带宽使用率(百分比)

OpManager 从不同地理位置的各种探针监控并收集这些关键参数的数据,然后将其发送到OpManager的中心服务器。数据随后被传送到LAMA服务器,并向经纪人通知数据是否已成功传输。

OpManager Plus 是一款统一的IT运营管理解决方案,具备先进的全栈监控和AIOps能力。它还能简化服务器监控、应用程序监控、带宽监控、配置管理、防火墙安全与合规性以及IP地址和交换机端口管理。这正是全球超过一百万IT管理员选择ManageEngine ITOM解决方案的原因。

常见问题(FAQs)

  1. SEBI的LAMA框架主要针对哪些问题?

    答:LAMA框架旨在应对日益增长的、对股票经纪人数字交易系统技术故障的担忧。它要求股票经纪商建立基于API的日志记录与监控机制,以监控关键交易基础设施,确保系统稳定,并在发生故障时快速响应和报告。

  2. 根据SEBI定义,什么情况会被认定为技术故障?

    答:技术故障指的是股票经纪人系统内的任何故障,包括硬件、软件、网络、流程或任何产品或服务的故障,且该故障导致系统正常功能停止、放缓或异常,持续时间达到五分钟或以上。

  3. 股票经纪商在遵循LAMA框架时面临哪些主要挑战?

    答:主要挑战包括:建立与现有IT基础设施集成的监控系统;满足严格的数据传输、报告与留存要求(如故障后1小时内通知、14天内提交根本原因分析报告);进行容量规划(需达到峰值负载1.5倍的容量);以及建立业务连续性/灾难恢复设置,这些都可能涉及显著的成本和资源投入。

  4. OpManager Plus如何帮助股票经纪商满足LAMA的容量规划要求?

    答:OpManager Plus提供对网络资源的全面监控,包括峰值负载、服务器容量和网络带宽。通过持续监控这些参数,股票经纪商可以主动评估基础设施容量,识别潜在瓶颈,并确保已安装容量至少达到日历季度内观测到的峰值负载的1.5倍,从而满足SEBI的容量规划要求。

  5. OpManager Plus在故障响应和报告方面提供哪些支持?

    答:OpManager Plus通过迅速的根本原因分析帮助股票经纪商快速定位技术故障根源,从而采取针对性行动减少停机时间。同时,它内置LAMA功能,监控关键参数并生成深入的历史报告,协助经纪商满足故障后一小时内通知、T+1提交初步报告以及14天内提交根本原因分析报告等合规要求。

我们的客户