Dianxin kexue (May 2024)

网络服务异常事件告警因果图构造方法

  • 张蕾1, 靖宇涵2,3, 何波2, 戚琦2, 陈晨3, 王敬宇2

DOI
https://doi.org/10.11959/j.issn.1000-0801.2024091
Journal volume & issue
Vol. 40, no. 5
pp. 152 – 164

Abstract

Read online

网络服务系统中,异常事件的发生经常导致系统中产生大量告警事件,形成告警风暴。运维人员需要花费大量的时间和精力从这些告警数据中寻找关键信息、确定异常事件的根源。为了减少运维人员所需处理的告警数量,智能化、自动化地提取告警风暴中的根源告警,基于网络服务告警的传播模式分析,提出了一种告警因果图构造方法,并将其应用于提取异常事件发生时的告警风暴关键信息。实验使用运营商现网管理系统的真实数据集,通过告警风暴摘要提取实验,验证了告警因果图生成的效果,并进行了相关案例的物理意义分析。结果表明,使用告警因果图生成的方式进行告警风暴摘要提取,达到了96%的召回率,保留了绝大部分关键信息。同时,使用该方法对系统产生的告警进行压缩,对较难压缩的告警码的压缩率能够达到66.5%。

Keywords