从APM到AIOps华青融天如何解决棘手运维难题
人工智能和机器学习技术的发展,推动大量依赖人脑决策和手工操作的IT 运维向着AIOps智能运维的方向快速前进。特别是当机器学习算法与基于大数据的业务运维管理平台整合,在告警过滤、异常监测、自动修复等环节发挥效用,就能把CIO和IT部门从繁复耗时、容易出错的基础运维工作中彻底解放出来,专注于更有价值的业务运维。
纵观目前涉及AIOps的厂商,有两个技术流派。其一是从传统底层基础设施运维中走出来,借助机器学习技术,向上去与业务运维管理平台整合。其二是从业务性能监控解决方案出发,配合运维数据平台和数据分析大脑,通过自动分析监控数据并给出运维决策建议,大幅度提升运维决策的时效性和准确性。
“自上而下”的运维模式
华青融天就属于后者。至于两种技术流派的区别,华青融天产品解决方案总监包彤举例谈到,“对于华青融天所服务的金融大型客户来说,最需要的是从上往下的运维模式,比如有时候CPU 80%系统告警,如果对用户体验没有影响,那就不那么紧急;但如果CPU占用没那么高,但用户已经抱怨得很厉害了,就要尽快处理。”
华青融天产品解决方案总监包彤
也正是因为这样,华青融天新一代AIOps产品EZSonar4.0版本,在原有基础上历时一年多才完成升级迭代,从数据采集、传输到存储分别使用了自主研发的探针、Kafka和大数据搜索引擎ElasticSearch。华青融天技术总监王勇谈到,对这几个模块进行实时监控就可以有效的了解系统自身运行状态,一旦发现异常可以快速处置,而且通过长时间的监测积累,可以为诊断系统瓶颈,进而评估硬件是否需要扩容提供有力依据,最终把产品作为一个可以吸收其他数据,以根因、分析为目标的综合性的运维数据平台。
不仅如此,EZSonar4.0为了降低系统复杂度且易扩展新功能,采用了微服务的设计思想,对于开发人员可以集中在较短的时间周期内完成服务的开发,也就避免因代码交接工作不充分造成的很多遗留问题,另外由于每个服务的代码量较小,即使有新人来接手也会较容易弄清楚系统的逻辑,也就方便了问题的修复和新功能的添加。另外,由于每个微服务是一个独立的系统,可以采用单独的技术架构和开发语言,这就使得更多新的技术施用于新的应用中,带来了技术创新和崭新的开发理念。
多维度关联分析 定位问题 解决问题
借助华青融天EZSonar4.0强大的可视化仪表盘功能,不仅大大提升了仪表盘展示的可视性和配置的便捷性,让用户亲身参与到监控场景的定制中来,同时改变了过去将仪表盘简单视为一种工具的认识,可视化仪表盘实际上提供了一个按场景定制的可视化平台,并支持用户根据需要随时调整监控策略。用户可根据自己关注的业务场景,对监控内容进行灵活调整,往往能发现更多看不见的价值。
华青融天技术总监王勇
在日常运维工作中,当运维人员在业务墙上发现了告警提示,可以点击告警进入“业务路径”观察在路径上相邻的节点或连线间都产生了哪些告警提示,然后依次点击查看各节点对应的指标数据,如果需要查看更多维度关联后的指标数据,点击“多维分析”可手动配置对多维度进行关联,展现明细数据。运维人员根据更多详细数据,结合自己对系统结构的认知,依次推断,逐项排查可能的问题点,最终定位问题根源。
至于能不能再“激进”一些,做到省略排查过程,直接由系统告知原因呢?包彤谈到,华青融天开始将AI方法拓展到异常分析的领域,正在与清华大学AIOps实验室的教授专家们在探讨模型,试图延伸和串联起异常发现、异常分析到异常定位完整异常诊断流程,后续会把这些功能加入到产品中。
尽管目前还需要积累更多的业务数据对算法进行训练,根据实际业务的需要对算法进行契合调整,相信很快华青融天能基于金融、保险、税务等相关行业串联起更多的业务场景,支撑起AIOps应用的一片天地。
原文发布时间为:2018-06-8
本文作者:张存
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
干货:一种基于SDN的服务器负载均衡方案
网络已经成为许多商业的支撑脊柱,世界网络中每天都有新的设备加入,致使网络规模巨大化。众多的网络设备不仅意味着需要投入更多的资源,且使网络结构越加复杂化,管理难度增大且易错。为了避免网络管理错误的发生,一种新型的网络架构出现,即软件定义网络(Software Defined Networking,SDN)[1]。SDN技术旨在实现控制层与数据层面的分离,而控制层是物理上集中的一系列控制器。这些控制器通过开发一系列应用能够检测和管理网络行为,实现网络可编程化。SDN可以实现各种传统物理网络的功能,如负载均衡。软件定义网络中的控制器通过改变数据平面交换机的流表项来调整受影响的流到冗余路径上传输,从而避免网络资源被过度占用[2]。 在云场景中,LBaaS(Load Balancing as a Service,负载均衡即服务)是Openstack[3]云计算平台已经投入研究的负载均衡解决方案。但是,它搭载的Openstack项目——网络和地址管理(Neutron)仅能实现指定目标的网络访问。在大型云应用场景中,LBaaS并不能支撑起负载均衡业务。于是,Openstack中将SDN作为Neutr...
- 下一篇
走出架构误区,架构师并不是想象的那么容易
几年前还记得我发表的软件设计的几大误区吗? 随着时代的发展,orm被更多人接受,九十年代出来的设计模式也被动地融入到主流框架,以至于设计模式到现在发展成了架构模式和业务模式,而存储过程也被开发者更少地使用。 之前提到的误区到现在已经没有什么争议了。 但随着年代的变迁,从前的小程序员也成了有多年工作经验的大咖了,更多人的头衔从程序员贴上了架构师标签。 而在互联网如此火的今天,在这样一个年代里,我又要出来指出几个误区。 误区一: 一套开发框架代替架构师 首先我们来看下,架构师全称为“软件系统架构设计师”。 名字很长,但拆分开来是xxxxxx设计师,前面加上“架构”这一词突出了是一个从更高层次的考虑问题的设计师,最终还是个“设计师”。 更高层次是相对而言,相对ui设计、局部的功能设计,更高层次是总体的设计,并不是说架构设计要比ui设计厉害或重要。 “软件系统”则限定了在软件系统范围内的设计师,而不是弱电、土木工程等设计师。 一套开发框架只是代码架构,没错是架构,但实际开发中会对代码架构剪裁,这取决于需求的理解和系统的设计,类似嵌入式工程师对架构剪裁。 这其中最重要的因素还是在于人为的设计,而...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8