单集群 100 节点！资源占用远小于 Grafana Mimir —— GreptimeDB 海量数据写入性能报告-低调大师

单集群 100 节点！资源占用远小于 Grafana Mimir —— GreptimeDB 海量数据写入性能报告

2024-08-02 411

GreptimeDB 在行业标准测试 Prometheus-Benchmark 当中以 100 个 8c16g 规格节点的集群，在 datanode 峰值水位为 CPU 38% 、内存 40% 的负载下，承接了每秒约 4000 万点 的写入流量。总体活跃时间线 6.1 亿条 ，每十分钟更新 615 万条时间线，在测试的 1.5 小时内均能稳定写入。

（图 1：GreptimeDB 数据采入）

测试结果说明 GreptimeDB 的架构设计能够支撑超大规模的数据集群，并且在同等规模集群下，GreptimeDB 的资源占用极低。对比同样适用对象存储的 Grafana Mimir，在处理同等规模的数据下，Mimir 需要消耗 5 倍以上的 CPU 和内存资源（基于 Mimir 测试报告折算）。

测试环境及工具

本轮测试中所使用的 Prometheus Benchmark 压测工具的相关关键参数及解释如下：（图 2:tsbs 参数）

通过如上配置最终构建的理论数据产生速率约每秒 4160 万点。

测试环境中一共有两个集群，分别是上述的 Prometheus Benchmark 的压力集群和 GreptimeDB 的数据库集群。两个集群均在 AWS EKS 部署。其中，GreptimeDB 集群所使用的镜像版本为 v0.8.2 所涉及到的各组件的部署规格及数量如下表所示：（图 3:v0.8.2 涉及参数）

GreptimeDB 集群的 WAL 组件为 AWS EBS；SST flush 以及 compaction 均基于 S3 完成。本地盘规格为 GP3，S3 为相同 Region 的 Standard 类别。在本次测试中不包含节点调度迁移等的情况，各个节点之间使用 Round-Robin Selector 均匀分配数据分区，一共有 200 个 Regions。

详细测试数据

写入吞吐

本次测试一共持续约 1.5 小时，总和写入量以及分节点的写入量监控数据如下，可以看到在 1.5 个小时内集群写入流量能一直稳定保持在每秒约 4000 万点的速率：（图 4:写入流量示例）

资源占用

对 GreptimeDB 集群水位进行观察，可以看到如下数据：

Datanode 的总和 CPU 使用率。总核数为 100 * 8c = 800c，峰值为 305，约占 38%。（图 5:Datanode 的总和 CPU 使用率）
Frontend 的总和 CPU 使用率。总核数为 50 * 8c = 400c，峰值为250，约占 63%。（图 6:Frontend 的总和 CPU 使用率）
Datanode 的总和内存占用。总内存为 100 * 16GiB = 1600 GiB。峰值为640GiB，约占 40%。（图 7:Datanode 的总和内存占用）
Frontend 的总和内存占用。总内存为 50 * 16GiB = 800 GiB。峰值为 110 GiB，约占 14%。（图 8:Frontend 的总和内存占用）

存储写入流量

下图是 S3 写入流量的统计，带宽占用基本在 512 MiB/s 以下，最终一个半小时内的总写入量为 2.8 TiB。（图 9:S3 写入流量统计）

而 WAL 组件观测到的写入流量约为 800 MiB/s。通过两张图的对比能够看到 GreptimeDB 对数据进行了有效压缩，压缩比达到 75% ，降低了数据刷写流量。最终压测结束时 S3 的目录大小远小于 1 TiB。（图 10:WAL 组件观测到的写入流量）

结语

100 个节点远远不是上限，本次测试验证了 GreptimeDB 架构无限扩展的能力，对比同样基于对象存储的 Grafana Mimir 有 5 倍的资源消耗降低。

下一步我们将进一步优化性能和测试，使 GreptimeDB 可承载海量时序指标数据的读写和分析。本次测试的版本是 v0.8.2， GreptimeDB 已发布 v0.9.0 版本，引入了日志引擎和全文检索能力，进一步优化了性能和稳定性，朝着成为一个融合 Metrics、Logs 和 Events 的统一时序数据库迈进了一大步，欢迎各位开发者测试使用。

关于 Greptime

Greptime 格睿科技专注于为可观测、物联网及车联网等领域提供实时、高效的数据存储和分析服务，帮助客户挖掘数据的深层价值。目前基于云原生的时序数据库 GreptimeDB 已经衍生出多款适合不同用户的解决方案，更多信息或 demo 展示请联系下方小助手（微信号：greptime）。欢迎对开源感兴趣的朋友们参与贡献和讨论，从带有 good first issue 标签的 issue 开始你的开源之旅吧～期待在开源社群里遇见你！添加小助手微信即可加入"技术交流群"与志同道合的朋友们面对面交流哦~ Star us on GitHub Now: https://github.com/GreptimeTeam/greptimedb 官网：https://greptime.cn/ 文档：https://docs.greptime.cn/ Twitter: https://twitter.com/Greptime Slack: https://greptime.com/slack LinkedIn: https://www.linkedin.com/company/greptime/

微信关注我们

原文链接：https://my.oschina.net/u/6839317/blog/15101284

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里云联合中国石油大学（北京）举办油气大模型创新大赛

8月2日，在“第三届中国油气人工智能科技大会”上，由阿里云与中国石油大学（北京）共同发起的油气人工智能创新大赛正式揭幕。大赛依托于由中国石油大学（北京）联合中石油、中石化、中海油等油气及科技领军企业联合发起成立的“油气人工智能产学研创新联盟”，也是业内首个围绕大模型展开的油气行业人工智能大赛。目前，大模型技术正在成为解决能源油气行业关键问题的重要手段。比如，在上游勘探领域，业内正在探索如何用大模型解决测井相关问题；在下游新能源车充电领域，非充电车辆占用充电桩停车位的情况常有发生，如何让利用大模型打造智能监测系统成为充电终端运营过程中亟待解决的问题等。因此，首届大赛将聚焦于两大领域：一是油气人工智能小模型与大模型的融合创新；二是油气与新能源的智能化融合创新。参赛选手可通过阿里云天池大赛平台报名参赛，并结合通义大模型、阿里云百炼平台、云原生等技术完成AI大模型和智能云场景的创新方案开发实践。中国石油大学（北京）校长金衍表示：“能源行业正处在产业结构调整的关键期，作为能源数字化的主战场，油气行业全价值链条长，数字化技术的应用和数字化变革将极大促进能源行业的发展。” 能源油气行业是典...

2024-08-02

326

AIGC（AI Generated Content，人工智能生成内容），即通过大量数据训练而成的人工智能系统，可根据用户的个性化指令生成文本、音频、图像、代码等内容。自 2022 年 OpenAI 公司推出 ChatGPT 以来，众多科技巨头和初创公司都加速其在 AIGC 领域的布局，如谷歌、微软、百度、华为等，都在开发自己的 AIGC 技术或产品。由此也开辟了通过 AI 内容生成服务收费、提供定制化内容解决方案等基于 AIGC 技术的商业模式。 AIGC 行业持续受到资本市场的高度关注和青睐。据不完全统计，2024年上半年，全球 AIGC 行业融资总额达到 1384 亿元，累计发生投资事件 363 次，总融资金额较去年同期增长23.3%（2023年为1123亿人民币），且在融资次数上猛增307.9%（2023年为89次）。在短短两年的时间里，AIGC 技术发展快速，正逐步实现多模态融合的突破，例如，通过整合文本、图像和声音，AIGC 技术正在创造更为多元和复杂的内容形式，进一步拓宽了其在游戏、影视制作、出版业、金融分析、数字人创建等多个应用场景中的巨大的潜力和价值。 AIGC 技术...

2024-08-02

328

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。