蚂蚁集团异常检测和归因诊断分析实践
分享嘉宾|丁雷雷蚂蚁集团算法专家 硕士毕业于北京邮电大学自动化学院,曾在阿里妈妈搜索直通车做广告算法。目前在蚂蚁机器智能部,从事异常检测、时序预测、归因分析、因果推断算法工作。 本文将分享异常检测与归因诊断在蚂蚁集团的实践。主要围绕归因诊断、异常检测、问题与挑战三个方面展开。 归因诊断 在实际工作中,我们常常受到业务方对关键绩效指标(KPI)的灵魂拷问:某个 KPI 指标为什么会上升或下降?归因诊断的任务就是解释这些指标变化的原因。 归因诊断把问题的定位过程看作是一个因子对比的过程:指标在基准时间区间的值为 y,在当前时间区间的值为 y^',两个时间点相差∆y。基于这个变化量∆y 进行因子的拆解,生成一个因子指标树。在每个叶子节点处,都计算其对整体∆y 的贡献度,从而确定哪个因子对整体贡献最大。通过以上过程,就能够解释 KPI 波动的原因。在实际应用中,可以支持: 多时间粒度的对比,包括单天和多天的对比; 单指标的对比、多因子的归因以及复杂的四则运算; 维度的组合与下钻; 千万级数据量级上秒级的智能返回; 接下来举例说明上述归因过程。在实际业务中,假设支付成功率从 80% 下降到 60...
