新鲜出炉|基于深度学习的运维日志领域新进展
作者:云智慧算法工程师 Hugo Guo
运维日志领域研究方向主要包含异常日志检测、日志模式解析、日志内容分类、日志告警等。本篇文章介绍了热门异常检测模型 DeepLog、A2Log 等模型,以及云智慧自研模型 Translog 等。与此同时,在文章最后介绍了未来基于深度学习的运维日志领域主要研究方向。
日志研究概述
日志任务与数据
日志是运维领域中的必不可少的一种半结构化数据类型,基于此开展的研究任务也多种多样。
日志数据实时处理主要包含以下几方面:
Log Compression:在运行时压缩软件日志。
Log Parsing:从软件日志中自动提取事件模板和关键参数。
Log Mining:提高系统的可靠性,主要关注异常检测。
日志模式解析
海量日志数据之间语义相似性较高,实际需求需要将日志表示化。因此学者期望对日志提取出固定的模版以求代表整个日志数据库。
下方为四个经典的日志模式解析算法:
Drain(基于树结构相似度)
Spell(最长公共子序列)
AEL (常数和变量的发生频率)
IPLoM(迭代分区策略,根据消息长度、令牌位置和映射关系等)
下图为日志模版提取过程,从上到下依次是原始日志,解析后的日志模版。
学术前沿工作分享
- DeepLog
DeepLog 是日志深度学习开山之作,采用LSTM编码提取好模板的日志并为给定序列中的下一个模板提供了一个具有概率的排序输出,以此进行异常检测。
- A2Log
A2Log 采用无监督的方式去寻找正常和异常之间的boundary,基于Attention机制和最新的Transformer框架,对正常的日志输出得分根据阈值去判别boundry。
- LogRobust
LogRobust 双向LSTM+Attention进行编码分类,对原始日志的模版进行word vector的向量化送入模型进行分类。
- HitAnomaly
HitAnomaly 是对于日志模版和参数分别采用Transformer进行编码。
- Logsy
Logsy 测试数据来源于新的系统,同时最后将异常分数加入考虑。
自研模型分享
- Translog
Translog 首次考虑多来源、资源不对齐的日志源异常检测。是基于 Transfer learning 和 Transformer 的全新框架 Pretraining 和 Tuning 的学习范式,通过 Translog 消耗可降低为原来的5%,但是效果达到 SOTA。
- Adapter
Adapter 的结构十分简单,像一个适配器为大模型的知识流动进行贯通。
下图右所示的是不同的日志源有着相同的异常问题,为迁移学习提供可能性。
云智慧将 Adapter 在三个公开数据集上进行测试,最终 Adapter 算法都获得了SOTA。同时 Adapter 的参数量减少了将近百分之95%
下图左方的试验说明预训练的方式会比直接从头开始训练更快收敛,同时会在较少的step下得到更高的F1分数。下图右方试验说明不同数据源的预训练的模型会产生不同的效果,发现BGL的预训练模型效果更好。
下图试验说明 Translog 在 low-resource 会表现出比正常的更好的结果。说明对于其他分布不均衡的日志源我们的模型也会有一定较好的效果。
- Log L G
LogLG 是日志 parsing 和 detection 一体的 end-to-end 框架,以弱监督的方式提取日志 raw 语料中的关键词。与此同时,LogLG 是一种全新的日志模版数据结构,提出了模版图的概念。
- Motivation
日志中有些关键词之间的联系模型往往忽略,例如warning这个关键词,既存在正常日志中,也存在异常日志。需要建立细粒度的关键词联系。日志的标签获取较难,弱监督或者无监督的方式会更易于用在实际中。以往的日志异常检测对于解析和检测分开,或者没有解析,这都会造成日志信息的冗余或者消失。
- Multimodality for AIOps
Multimodality for AIOps 是日志(logs)、调用链(traces)、指标(metres)三者相辅相成构成运维领域的多模态问题。任务设计方面输入为多种模态数据,预测下一个template(Next Template Prediction)。模型采用Transformer架构,embedding方式采用bert,最大程度的保存原始多模态信息。
未来研究方向
因日志和运维数据本身的结构特点,预测接下来该领域深度学习研究的痛点和可能发展方向主要为以下三方面:
日志本身的标签获取较难,无监督或者弱监督的深度方法将大量涌现,帮助该领域人员在无标签的数据情况下更好的从事实际研究和落地发展。
日志领域多模态领域的发展,扩充日志本身的原始信息,因此会出现很多的基于自监督的方法和多种模态数据相结合的方向,朝着运维一体化更好的发展。
大规模预训练日志模型被需求,一个学习各种运维知识和日志模式的大模型将在未来充当AIOps的研究典范。更好服务下游各种任务。
开源项目推荐
云智慧已开源数据可视化编排平台 FlyFish 。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现符合自己业务需求的炫酷可视化大屏。 同时,飞鱼也提供了灵活的拓展能力,支持组件开发、自定义函数与全局事件等配置, 面向复杂需求场景能够保证高效开发与交付。
如果喜欢我们的项目,请不要忘记点击下方代码仓库地址,在 GitHub / Gitee 仓库上点个 Star,我们需要您的鼓励与支持。此外,即刻参与 FlyFish 项目贡献成为 FlyFish Contributor 的同时更有万元现金等你来拿。
GitHub 地址: https://github.com/CloudWise-OpenSource/FlyFish
Gitee 地址: https://gitee.com/CloudWise/fly-fish
微信扫描识别下方二维码,备注【飞鱼】加入 AIOps 社区飞鱼开发者交流群,与 FlyFish 项目 PMC 面对面交流~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
多点DMALL × Apache Kyuubi:构建统一SQL Proxy探索实践
伴随着国家产业升级的推进和云原生技术成熟,多点 DMALL 大数据技术也经历了从存算一体到存算分离的架构调整变迁。本文将从引入 Kyuubi 实现统一 SQL Proxy 的角度讲述这一探索实践的历程。 多点 DMALL 成立于2015年,提供一站式全渠道数字零售解决方案 DMALL OS,目前已与130+连锁零售企业、近1000家品牌达成合作,覆盖5个国家和地区。作为一站式全渠道数字零售解决方案服务商,多点 DMALL 通过数字化解构重构零售产业,提供端到端的商业 SaaS。方案整体涵盖了从商品选择、供应商引入、仓储供应链管理、门店经营、用户精准营销的整个产业链,实现了人人、事事、物物在线。 Apache Kyuubi 是网易数帆发起开源的一个分布式和多租户网关,用于在 Lakehouse 上提供 Serverless SQL,社区目前已聚集海内外百余名贡献者。 作为 DMALL OS 数字化能力的技术底座,大数据平台历经多次迭代平稳支撑了公司 To B 业务的开展。伴随着国家产业升级的推进和云原生技术成熟,多点 DMALL 大数据技术也经历了从存算一体到存算分离的架构调整变迁。本文...
- 下一篇
MakuCloud v2.4 发布,最简洁的微服务解决方案
项目说明 maku-cloud 是采用 Spring Cloud Alibaba、SpringSecurity、Spring Cloud Gateway、SpringBoot、Nacos、Redis、Mybatis-Plus 等框架,开发的一套 SpringCloud 快速开发平台,使用门槛极低,且采用 MIT 开源协议,完全免费开源,可免费用于商业项目等场景。 官网地址:https://maku.net 开发文档:https://maku.net/docs/maku-cloud 演示环境:https://demo.maku.net/maku-cloud 更新日志 新增系统服务监控 新增缓存服务监控 新增SpringBootAdmin监控 新增接口文档菜单 新增公共配置文件 优化Web配置项 升级代码生成器模块 修复网关路由错误问题 前端工程 Gitee 仓库:https://gitee.com/makunet/maku-admin Github 仓库:https://github.com/makunet/maku-admin 后端工程 Gitee 仓库:https://gitee.c...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址