vivo Pulsar 万亿级消息处理实践 (2) - 从 0 到 1 建设 Pulsar 指标监控链路
作者:vivo 互联网大数据团队- You Shuo 本文是《vivo Pulsar万亿级消息处理实践》系列文章第2篇,Pulsar支持上报分区粒度指标,Kafka则没有分区粒度的指标,所以Pulsar的指标量级要远大于Kafka。在Pulsar平台建设初期,提供一个稳定、低时延的监控链路尤为重要。 系列文章: 《vivo Pulsar万亿级消息处理实践-数据发送原理解析和性能调优》 本文是基于Pulsar 2.9.2/kop-2.9.2展开的。 一、背景 作为一种新型消息中间件,Pulsar在架构设计及功能特性等方面要优于Kafka,所以我们引入Pulsar作为我们新一代的消息中间件。在对Pulsar进行调研的时候(比如:性能测试、故障测试等),针对Pulsar提供一套可观测系统是必不可少的。Pulsar的指标是面向云原生的,并且官方提供了Prometheus作为Pulsar指标的采集、存储和查询的方案,但是使用Prometheus采集指标面临以下几个问题: Prometheus自带的时序数据库不是分布式的,它受单机资源的限制; Prometheus 在存储时序数据时消耗大量的内存,...



