实用干货丨如何使用Prometheus配置自定义告警规则
前 言 Prometheus是一个用于监控和告警的开源系统。一开始由Soundcloud开发,后来在2016年,它迁移到CNCF并且称为Kubernetes之后最流行的项目之一。从整个Linux服务器到stand-alone web服务器、数据库服务或一个单独的进程,它都能监控。在Prometheus术语中,它所监控的事物称为目标(Target)。每个目标单元被称为指标(metric)。它以设置好的时间间隔通过http抓取目标,以收集指标并将数据放置在其时序数据库(Time Series Database)中。你可以使用PromQL查询语言查询相关target的指标。 本文中,我们将一步一步展示如何: 安装Prometheus(使用prometheus-operator Helm chart)以基于自定义事件进行监控/告警 创建和配置自定义告警规则,它将会在满足条件时发出告警 集成Alertmanager以处理由客户端应用程序(在本例中为Prometheus server)发送的告警 将Alertmanager与发送告警通知的邮件账户集成。 理解Prometheus及其抽象概念 从下图...