克服 Prometheus 单值数据模型的局限性：GreptimeDB 的新路径-低调大师

克服 Prometheus 单值数据模型的局限性：GreptimeDB 的新路径

2024-05-10 426

引言

Prometheus 已经成为监控和报警生态系统的基石，在高效、直接地处理实时指标（Metric）方面有着强大的表现。Prometheus 的核心是一个包含单个值和一系列标签的数据模型。这种设计在提升简单性和适应性的同时，也带来了一些挑战，包括影响数据收集效率、分析深度和查询能力。

本文探讨了 Prometheus 单值数据模型的固有限制，GreptimeDB 如何成为一个解决这些问题的创新方案，并结合若干实例说明其中的差别。

单值数据模型的挑战

1. 数据收集中的冗余标签传输

Prometheus 的数据模型要求测度（Measurement）上报时总要携带同一来源的所有标签，当测量需求涉及多个值时，意味着重复传输这些标签，从而导致数据收集和存储效率低下。虽然 Prometheus 的存储引擎优化了数据存储，但标签信息冗余问题仍是一个重大的开销。

示例：在从服务器集群收集 CPU 使用率、内存使用量和磁盘 I/O 等多个指标的场景下，每个指标都携带相同的标签，如 cluster_name、region、instance 和 server_type，这就导致了不必要的重复。

示例图：instance 标签在三个指标中重复出现

丢失测度（Measurement）之间的关联

在没有结构化分组或继承的机制的情况下，把相关的多个测度分隔成独立的指标，将会丢失测度之间的关联。这种分隔将使关联分析和查询变得困难，也限制了对指标之间相互影响的洞察。

示例：以监控 Redis 为例，使用多个指标来分别跟踪内存使用量、命令处理率和活动连接等行为，会使得分析它们之间的相互影响非常困难。例如，内存使用量如何影响命令处理效率。

查询复合监控视图的复杂性

创建全面的监控仪表板，需要从多个独立的 PromQL 查询中聚合数据，但这样的构建逻辑会使仪表板构建复杂化并增加不必要的查询开销。

示例：有效监控一个 Kubernetes 节点的仪表板需要聚合 CPU 负载、内存消耗、网络 I/O 和 pod 计数等多个指标，每个指标都需要单独地进行 PromQL 查询，但这样的行为会复杂化仪表板的设置，甚至可能影响性能。

GreptimeDB 的解决方案

为了应对上述挑战，GreptimeDB 在支持 PromQL 查询时，实现了一个创新解决方案来规避单值模型的局限。

1. 相关指标成组地聚合存储

GreptimeDB 为这类监控场景开发了 Metric Engine 存储引擎。它支持在底层聚合存储多个测度，而在应用层呈现出单值模型的视图。这大幅降低了存储成本，并提高了查询若干相关的测度时的性能。

2. 多值采样和不同的值类型

GreptimeDB 允许来自单一数据源的样本存储多个值，支持浮点数等多种值类型。

示例：监控 Redis 在一个或多个时间序列中存储的数据，其中标签作为独立的标签列存储，分组测量作为不同的字段列。这种方法减少了标签传输的冗余，保留了数据关联性，并能够优化相关的分析和查询性能。

示例图：监控 Redis 提取多个数据值

3. 扩展 PromQL 以查询多个字段

GreptimeDB 增强了 PromQL 以允许查询并返回多个字段值的能力。要指定特定字段，可以使用扩展的 __field__ 标签。

示例：查询 memstats{ __field__ = "used_bytes", __field__ = "free_bytes"}，可以获取两个时间序列并一起渲染。这种扩展简化了复合监控视图下的查询，降低了组建具体仪表板负载的复杂性。

4. 支持表模型和 SQL 进行高级关联分析

GreptimeDB 的核心优势之一就是强大的分析能力，表现为支持表模型和使用 SQL 查询数据，这一能力在进行关联分析和执行复杂查询时，可以实现远超 PromQL 的灵活性。基于关系模型，用户可以连接多个数据集进行关联分析，更深入且细致地挖掘监控系统数据的价值。

示例：在复杂的监控场景中，需要将服务器性能指标与应用错误日志相关联，GreptimeDB 允许用户使用 SQL 一起查询这些数据。比如，执行一个 SQL 查询时，可以根据时间戳将 CPU 使用率的指标与应用错误日志关联起来，就能够提供 CPU 使用率上升与错误率增加的关联的监控视角。如果仅用 PromQL 来实现这种分析，即便可行，实现过程也会非常繁琐复杂。

👀 (P.S. GreptimeDB 正在实现专业的日志存储支持，敬请期待）

支持表模型和 SQL 查询，让 GreptimeDB 能够帮助用户从传统 SQL-based 系统平滑地切换到专业的时序数据栈上。同时这也使得用户无需应对 PromQL 陡峭的学习曲线，直接开始深入挖掘时序数据价值，包括基于监控数据的进行基本展示，完成复杂的性能分析，排查系统存在的故障等一系列广泛的分析任务。这是 GreptimeDB 的技术创新为监控数据获取、存储和实用化带来的一大进步。

结论

尽管 Prometheus 的单值数据模型有助于用户简单上手，并且目前已经被广泛采用，但是它在数据收集效率、测度关联性和查询复杂性方面都面临明显的挑战。GreptimeDB 的解决方案克服了这些限制，提供了更有效的数据收集方法，增强了关联分析，并简化了查询，能够帮助用户高效获取全面的监控视图。

GreptimeDB 作为开源项目，欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手，期待在开源社群里遇见你！ Star us on GitHub Now: https://github.com/GreptimeTeam/greptimedb 微信搜索 GreptimeDB，关注公众号不错过更多技术干货和福利~

关于 Greptime

Greptime 格睿科技专注于为物联网（如智慧能源、智能汽车等）及可观测等产生大量时序数据的领域提供实时、高效的数据存储和分析服务，帮助客户挖掘数据的深层价值。目前主要有以下三款产品：

GreptimeDB 是一款用 Rust 语言编写的开源时序数据库，具有云原生、无限水平扩展、高性能、融合分析等特点，帮助企业实时读写、处理和分析时序数据的同时，降低长期存储的成本。我们提供 GreptimDB 企业版，支持更多功能和定制化服务，如有需要欢迎联系小助手。

GreptimeCloud 是一款全托管的云上数据库即服务（DBaaS）解决方案，基于开源时序数据库 GreptimeDB 打造，能够高效支持可观测、物联网、金融等领域的应用。用户可以通过内置的可观测解决方案 GreptimeAI 全面地掌握 LLM 应用的成本、性能、流量和安全等情况。

车云一体解决方案是一款深入车企实际业务场景的车云协同数据解决方案，解决了企业车辆数据呈几何倍数增长后的实际业务痛点。多模态车端数据库结合云端 GreptimeDB 企业版帮助车企极大降低流量、计算和存储成本，并帮助提升数据实时性和业务洞察能力。

GreptimeDB 作为开源项目，欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手，期待在开源社群里遇见你！

官网：https://greptime.cn/

GitHub: https://github.com/GreptimeTeam/greptimedb

文档：https://docs.greptime.cn/

Twitter: https://twitter.com/Greptime

Slack: https://www.greptime.com/slack

LinkedIn: https://www.linkedin.com/company/greptime

微信关注我们

原文链接：https://my.oschina.net/u/6839317/blog/11105838

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

数仓安全：数据脱敏技术深度解析

本文分享自华为云社区《GaussDB(DWS)安全管理之数据脱敏原理与使用方法介绍》，作者： VV一笑。 1. 前言适用版本：8.2.0及以上版本 GaussDB (DWS)产品数据脱敏功能，是数据库产品内化和夯实数据安全能力的重要技术突破。提供指定用户范围内列级敏感数据的脱敏功能，具有灵活、高效、透明、友好等优点，极大地增强产品的数据安全能力，实现敏感数据的可靠保护。大数据时代的到来，颠覆了传统业态的运作模式，激发出新的生产潜能。数据成为重要的生产要素，是信息的载体，数据间的流动也潜藏着更高阶维度的价值信息。对于数据控制者和数据处理者而言，如何最大化数据流动的价值，是数据挖掘的初衷和意义。然而，一系列信息泄露事件的曝光，使得数据安全越来越受到广泛的关注。各国各地区逐步建立健全和完善数据安全与隐私保护相关法律法规，提供用户隐私保护的法律保障。如何加强技术层面的数据安全和隐私保护，对数据仓库产品本身提出更多的功能要求，也是数据安全建设最行之有效的办法。 GaussDB (DWS)产品8.1.1版本发布数据脱敏特性，提供指定用户范围内列级敏感数据的脱敏功能，具有灵活、高效、透明、友好等...

2024-05-10

364

本文分享自华为云社区《GaussDB(DWS)行执行引擎详解》，作者：yd_227398895。 1.前言 GaussDB（DWS）包含三大引擎，一是SQL执行引擎，用来解析用户输入的SQL语句，生成执行计划，供执行引擎来执行；二是执行引擎，其中包含了行执行引擎和列执行引擎，执行引擎即查询的执行者，位于优化器和存储引擎之间，负责将数据从存储引擎中读取出来，并根据计划将数据处理加工后返回给客户端，执行引擎的目标是为了更好地利用计算资源，更快地完成计算。三是存储引擎，决定了数据库数据的存取方式，直接影响了数据库的读写性能。其中行执行引擎应用于行存表中，传统的OLTP（OnLine Transaction Processsing 联机事务处理）场景与功能、业务强相关，数据需要进行频繁的增删改查，这时比较适合使用行存储式。行存储的优势主要有两个方面：首先是点查性能好，在点查场景下可以直接索引到某行数据的元组位置；其次就是更新效率高，行存储在实时并发入库，并发更新方面依然有着比较大的优势。行执行引擎的关键就是：一次处理一行数据，即一tuple，适合数据频繁更新，增删改操作多，且查询结果涉及表的...

2024-05-11

346

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。