必示智能运维平台,对接入的业务指标数据进行质量检测,筛选出缺失、延迟等不满足要求的指标予以标记,满足要求的指标,能够自动选择合适的算法进行异常检测,并生成指标动态基带,以网银系统为例,交易量指标往往存在较大的波动幅度,易在两个时段分别出现交易高峰,深蓝色曲线是实际的业务指标值,浅蓝色阴影是算法自动计算出的动态基带,即改指标的合理波动范围,当实时指标数据超出基带范围时,将被检测为异常,与交易量指标特征不同,成功率指标则相对稳定,在接近100%的区域波动,波动幅度很小,当实时指标数据超出基带范围时,将被检测为异常,该网银系统中,成功率、响应时间和未响应量等三条指标被检测出异常,根据我们预设的告警规则,最终生成告警通知告警管理人员,必示业务指标异常检测能够快速覆盖系统级、交易码级、IP级指标和其他细粒度的业务指标,采用动态基带实现更准确异常检测效果,有效提升告警准确率、减少告警数量,并降低固定基带告警规则的配置和维护工作量,必示业务指标异常检测,能够快速扩展监控范围,实现大规模细化监控。
【应用场景】
由于业务忙时和闲时的存在,反映业务系统健康状态的指标(如交易量、响应率、响应时间、成功率等)往往在不同时段呈现出不同的波动特征,导致固定阈值监控方式难以适应业务指标的数据特点,且人工配置告警规则的方式工作量 大,无法满足大范围、细粒度业务指标的监控需求。
本场景通过构建智能基线对业务黄金指标进行异常检测,识别业务指标时序曲线的反常变化,及早发现问题和风险,提升告警准确率,缩短故障发现和业务系统恢复时间。

【主要特征】
根据每条指标数据特征的不同自动选择合适的算法进行异常检测
无需人工标注异常数据
自适应指标波动周期及偏移的情况
自动识别无规律性指标,给出极限阈值
自动适配节假日、特殊日(如周末、春节等)
适配变更导致的指标剧变
检测合理范围内突变异常
检测规律行为缺失(如跑批失败)
自适应整体趋势性变化
不受少量数据缺失、中断影响
不受历史数据中异常干扰
【核心价值】
提升告警有效性:以动态阈值的监控方式对传统的固定阈值监控体系进行补充,更好地适应业务指标波动情况,减少无效告警数量,提升告警准确率;
降低运维人力成本:通过算法自动对海量业务指标进行批量训练和异常检测,构建大范围、细粒度的指标监控体系,减少固定阈值监控规则的配置和维护工作量,有效降低运维人力成本。
| 交付方式 | License | 版本 | V1.0 |
| 操作系统 | linux桌面应用 | 适配语言 | 中文 |
| 上架日期 | 2023-11-06 17:40:19 |