基于Grafana的监控报警平台
简介
监控报警平台以Grafana为基础,主要功能是将收集存储的数据按照不同维度、不同应用、不同用户进行配置化的展示;为了保证数据安全,每个团队只能看到自己的应用数据。同时对不同维度的数据,可以进行报警配置,根据最常用的报警方式,提供了钉钉报警、邮件报警、webhook报警三种方式。
平台地址根据访问用户的不同,如下:
集团内部用户:open-monitor.XXX.com(内部用户可ata搜索监控报警平台)
集团外部用户:open-monitor.1688.com
功能
好的功能,除了完成用户的基本需求外,另外很重要的一点就是用户操作的便捷性、用户体验的良好性。所以监控报警平台根据用户来源不同,分为了外部用户ISV和内部用户(集团员工)。在提供基本的数据展示、报警配置等功能的基础上,针对不同用户还提供了便于操作的默认大盘,数据隔离等等特性。
基础功能
数据展示
不管何种数据,只要是用户登录后,配置了自己所在组织的数据源,那么数据都可以进行展示。如下图:
报警提示
针对展示的业务数据或者系统数据,当某些值超过阈值时,需要对相关人员进行报警提示。如下图:
权限管理
提供了组织管理,团队管理,用户管理等基础功能,思路如下:
外部用户
针对外部用户ISV,为了最大程度的减少他们的操作,提供更便捷的系统,监控报警平台根据他们所拥有的appkey信息,自动生成了监控报警大盘,不需要任何配置,只需要对报警阈值进行适当调整即可。同时为了数据安全,ISV用户默认没有修改权限,由我们的开发或者运营相关人员进行操作。如下图展示了用户登录后系统默认创建的两个展示大盘。
内部用户
针对内部用户,给与了适当放权。每个组织的第一个登录平台的人,是该组织的管理员,后续登录的人员默认作为浏览者。如果需要升级权限,第一个登录的人进行角色的更改即可,以此保证了管理的有序性。如下图:
每个组织可能有多个应用,每个应用都是不同类型。比如有业务的应用(会员中心,商品中心、交易中心等),系统的应用(DB管理中心,压力测试中心等),如果都房子一起就有些混乱。我们还提供了创建文件夹的功能,因此可以根据不同类型的业务放入不同的文件夹,管理清晰方便。如下图:
实际情况中,一个人可能属于多个组织,那么该组织的管理员邀请一下该人,便可以进入该组织。如果有多个组织,可以自由切换到不同的组织,在不同的组织中,只能看到当前所在组织的相关大盘等数据。如下图:
架构
系统支持内部用户和外部用户访问,根据域名进行了区分。所有请求进入后,根据不同域名,分发到不同的代理层,经过代理层处理,用户进行登录操作,登录完成后进入Server端处理请求。如下图:
Buc-proxy
是为开源软件控制台提供的反向代理服务. 用于统一登录和权限控制。对其进行了修改,适合当前场景需求。整体流程如下图:
ISV-proxy
该代理是针对外部用户ISV的,使用zuul进行了前置filter处理,同时集成TBSession管理登录,自定义Filter获取Server端需要信息。如下图:
展示
组织管理员可以创建自己的大盘,进行不同数据的展示。
Grafana提供了各种展示数据的插件,极大地满足了展示的需求。展示的数据既有来自sls的数据,也有来自hitsdb的数据。
如下图:
报警
目前系统展示插件中支持报警的只有Graph,可以针对不同的指标设置不同的报警规则和通知方式。根据常用报警方式,完全支持了钉钉报警,邮件报警,webhook报警,短信报警因为签名问题暂时不对外开放。如下图:
钉钉报警
根据钉钉机器人可对钉钉群发送消息这一特性,对报警内容进行了重写,展示了报警状态(报警/恢复)、报警的具体链接、报警的原因。
邮件报警
如果需要将报警信息发送邮件,可以直接在创建报警的地方选择type为email即可。填写接收报警信息的邮箱地址。邮件报警内容包括:报警提示、报警原因、报警页面链接、报警列表链接
webhook报警
如果希望自己处理报警信息,那么可以使用webhook,会把报警信息都发送给指定的server,然后自行处理。
未来工作
1、目前如果一个人有多个展示大盘,登录后并没有直接显示,而是显示的Home页,为了让用户更直接的看到大盘信息,后边会选择一个默认打监控大盘或者用户最关注的大盘,登录后直接定位显示。
2、目前如果在展示图表中使用了变量,那么报警会无法使用,为了更全面的支持报警,做到报警无死角,同时又让用户配置更方便更灵活,需要对此进行优化
3、目前短信由于涉及费用问题,并且短信内容长度有限制,暂未对外开放。后期如果合适,会开放短信报警
总结
系统提供了权限管理,人员管理,数据展示与报警等各种功能,基本满足了需求。但是同时也存在问题,比如在报警、数据源支持hbase类型等,仍然需要去不断的完善,有问题随时可联系。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
springcloud云服务架构-HongHu commonservice-eureka项目构建过程
上一篇我们回顾了关于 spring cloud eureka的相关基础知识,现在我们针对于HongHu cloud的eureka项目做以下构建,整个构建的过程很简单,我会将每一步都构建过程记录下来,希望可以帮助到大家: <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <parent> <groupId>com.ml.honghu</groupId> <artifactId>particle-...
- 下一篇
区块链开发公司谈区块链有哪些算法
区块链架构是一种分布式的架构。其部署模式有公共链、联盟链、私有链三种,对应的是去中心化分布式系统、部分去中心化分布式系统和弱中心分布式系统。 分布式系统中,多个主机通过异步通信方式组成网络集群。在这样的一个异步系统中,需要主机之间进行状态复制,以保证每个主机达成一致的状态共识。然而,异步系统中,可能出现无法通信的故障主机,而主机的性能可能下降,网络可能拥塞,这些可能导致错误信息在系统内传播。因此需要在默认不可靠的异步网络中定义容错协议,以确保各主机达成安全可靠的状态共识。 非对称加密技术:拜占庭协定中,如果10个将军中的几个同时发起消息,势必会造成系统的混乱,造成各说各的攻击时间方案,行动难以一致。谁都可以发起进攻的信息,但由谁来发出呢?其实这只要加入一个成本就可以了,即:一段时间内只有一个节点可以传播信息。当某个节点发出统一进攻的消息后,各个节点收到发起者的消息必须签名盖章,确认各自的身份。 容错问题:我们假设在此网络中,消息可能会丢失、损坏、延迟、重复发送,并且接受的顺序与发送的顺序不一致。此外,节点的行为可以是任意的:可以随时加入、退出网络,可以丢弃消息、伪造消息、停止工作等,还...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Mario游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7