从 ClickHouse 到 ByteHouse：实时数据分析场景下的优化实践-低调大师

从 ClickHouse 到 ByteHouse：实时数据分析场景下的优化实践

2022-01-19 484

字节跳动旗下的企业级技术服务平台火山引擎正式对外发布「ByteHouse」，解决开源技术上手难 & 试错成本高的痛点，同时提供商业产品和技术支持服务。

作为国内规模最大的 ClickHouse 用户，目前字节跳动内部的 ClickHouse 节点总数超过 1.5W 个。综合来说，字节跳动广泛的业务增长分析很多都建立在 ClickHouse 为基础的查询引擎上。

在打造 ByteHouse 的路程中，我们经过了多年的探索与沉淀，本文将分享字节跳动过去使用 ClickHouse 的两个典型应用与优化案例。

广告投放实时数据

第二个典型案例关于广告的投放数据，一般是运营人员需要查看广告投放的实时效果。由于业务的特点，当天产生的数据往往会涉及到多天的数据。

这套系统原来基于 Druid 实现的，Druid 在这个场景会有一些难点：

选择了 ClickHouse 之后能解决 Druid 不足的地方，但还是有部分问题需要解决：

问题一：Buffer Engine 无法和 ReplicatedMergeTree 一起使用

社区提供了 Buffer Engine 为了解决单次写入生成过多 Parts 的问题，但是不太能配合 ReplicatedMergeTree 一起工作, 写入不同 Replica 的 Buffer 仅缓存了各自节点上新写入的数据，导致查询会出现不一致的情况。

解决方案

改进了 Buffer Engine 做了如下的调整和优化：

我们选择将 Kafka/Buffer/MergeTree 三张表结合起来，提供的接口更加易用；
把 Buffer 内置到 Kafka Engine 内部，作为 Kafka Engine 的选项可以开启/关闭，使用更方便；
Buffer table 内部类似 pipeline 模式处理多个 Block；
支持了 ReplicatedMergeTree 情况下的查询。

首先确保一对副本仅有一个节点在消费，所以一对副本的两个 Buffer 表，只有一个节点有数据。如果查询发送到了没有消费的副本，会额外构建一个特殊的查询逻辑，从另一个副本的 Buffer 表里读取数据。

增强 Buffer Engine，解决了 Buffer Engine 和 ReplicatedMergeTree 同时使用下查询一致性的问题。

问题二：出现宕机后可能会出现数据丢失后者重复消费的情况

ClickHouse 缺少事务支持。一批次写入只写入部分 Part 后出现宕机，因为没有事务保障重启后可能出现丢失或者重复消费的情况。

解决方案

参考了 Druid 的 KIS 方案自己管理 Kafka Offset，实现单批次消费/写入的原子语义：实现上选择将 Offset 和 Parts 数据绑定在一起，增强了消费的稳定性。每次消费时，会默认创建一个事务，由事务负责把 Part 数据和 Offset 一同写入磁盘中，如果出现失败，事务会一起回滚 Offset 和写入的 Part 然后重新消费。

确保了每次插入数据的原子性，增强了数据消费的稳定性。

结语

实时数据分析是 ClickHouse 的优势场景，结合字节跳动实时数据场景的特点，我们对 ClickHouse 进行了优化和改造，并将这些能力沉淀到了 ByteHouse 上。

ByteHouse 基于自研技术优势和超大规模的使用经验，为企业大数据团队带来新的选择和支持，以应对复杂多变的业务需求，高速增长的数据场景。

未来，ByteHouse 将不断以字节和外部最佳实践输出行业用户，帮助企业更好地构建交互式大数据分析平台，并更广泛地与 ClickHouse 研发者社群共享经验，共同推动 ClickHouse 社区的发展。

火山引擎 ByteHouse

统一的大数据分析平台。目前提供企业版和云数仓两种版本，企业版是基于开源 ClickHouse 的企业级分析型数据库，支持用户交互式分析 PB 级别数据，通过多种自研表引擎，灵活支持各类数据分析和应用；云数仓版作为云原生的数据分析平台，实现统一的离线和实时数据分析，并通过弹性扩展的计算层和分布式存储层，有效降低企业大数据分析 TCO。[点击申请体验]

欢迎关注字节跳动数据平台同名公众号

微信关注我们

原文链接：https://my.oschina.net/u/5588928/blog/5403913

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

线程的生命周期，真的没那么简单

摘要：结合操作系统线程和编程语言线程再次深入探讨线程的生命周期问题，线程的生命周期其实没有我们想象的那么简单！本文分享自华为云社区《【高并发】线程的生命周期其实没有我们想象的那么简单！！》，作者：冰河。今天，我们就结合操作系统线程和编程语言线程再次深入探讨线程的生命周期问题，线程的生命周期其实没有我们想象的那么简单！！理解线程的生命周期本质上理解了生命周期中各个节点的状态转换机制就可以了。接下来，我们分别就通用线程生命周期和Java语言的线程生命周期分别进行详细说明。通用的线程生命周期通用的线程生命周期总体上可以分为五个状态：初始状态、可运行状态、运行状态、休眠状态和终止状态。我们可以简单的使用下图来表示这五种状态。初始状态线程已经被创建，但是不允许分配CPU执行。需要注意的是：这个状态属于编程语言特有，这里指的线程已经被创建，仅仅指在编程语言中被创建，在操作系统中，并没有创建真正的线程。可运行状态线程可以分配CPU执行。此时，操作系统中的线程被成功创建，可以分配CPU执行。运行状态当操作系统中存在空闲的CPU，操作系统会将这个空闲的CPU分配给一个处于...

2022-01-19

410

SpringBoot 是基于 Java Spring 框架的套件，它预装了 Spring 的一系列组件，让开发者只需要很少的配置就可以创建独立运行的应用程序。在云原生的世界，有大量的平台可以运行 SpringBoot 应用，例如虚拟机，容器等。但其中最有吸引力的，是以 Serverless 的方式运行 SpringBoot 应用。我将通过一系列文章，从架构，部署，监控、性能、安全等5个方面来分析 Serverless 平台运行 SpringBoot 应用的优劣。为了让分析更有代表性，我选择了 github 上 star 数超过 50k 的电商应用 mall 作为示例。这是系列文章的第四篇，向大家展示如何对 Serverless 应用性能调优。实例启动速度优化在之前的文章实战教程中，相信大家都感受到 Serverless 的便捷之美，只需上传代码包和镜像就能够轻松上线一个弹性高可用的 Web 应用。但是它仍存在首次启动“冷启动延时”的问题，Mall 应用实例的启动大约 30 秒左右，用户会感受较长时间的冷启动延时，在这个“即时时代”应用程序响应慢多少会有些瑕不掩瑜。（“冷...

2022-01-19

460

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。