从ClickHouse的名字由来讲起
身边的朋友都知道,我正在写一本介绍ClickHouse的书籍,书名叫做《ClickHouse原理解析和应用实践》,可以说2019年的绝大部分深夜,都与写作共度春宵了。现在终于有时间来扯些闲篇了。在日常生活中,我算是一个比较注重仪式感的人,所以喜欢研究每个事物的名字,总觉得它们的背后一定是有所寓意的。
目前在国内,关于ClickHouse方面的,有深度的介绍资料并不多,大多都是千篇一律,所以就更别提有它的八卦资讯了。你看隔壁的Hadoop动物园,讨论的是多么热火朝天,难道大家就不好奇为什么ClickHouse要叫做ClickHouse么?
至少我是好奇的,无奈在网上一直查不到相关的资料,心想这只有问问作者本人了。恰巧在参加ClickHouse的一次闭门会议时,有机会当面向作者请教。我就用我那纯正的中式口音问道:
"What's the meaning of the name, why we call it ClickHouse ?"
当 Ivan 耐心的在黑板上写下几个大字以后,一切豁然开朗。
看到了名字的含义,再结合ClickHouse的发展历程,一切就解释的通了。
我们都知道,ClickHouse由雏形发展至今,一共经历了4个阶段。它的初始设计目标,就是为了服务于自家的一款名叫yandex metrica的产品。
那metrica又是干什么的呢?简单来说,metrica是一款Web流量分析工具,基于前方探针采集回来的行为数据,进行一系列的数据分析,类似数仓(data warehouse)的OLAP分析。
而在探针采集的数据模型中,一次页面点击(click),会产生一个event事件。至此,整个系统的诉求就很清晰了,那就是基于页面的点击事件流,面向数据仓库进行OLAP分析。
所以ClickHouse这名字起的是不是既形象又贴切呢?
在知道了ClickHouse大名的由来以后,我还想接着聊聊它的小名,也就是缩写啦。
此时此刻,我的内心台词:
"这货真的不是内裤,我要为他正名..."
不知道从何时开始,也不知道是何种原因,ck 就成为了ClickHouse的缩写,在圈内传开。当第一次看到有人用 ck 称呼ClickHouse的时候,我很是纳闷,心想: "这厮不是内裤么?"。
我们不妨看看英语单词的缩写,通常是怎么命名的。首先分析一下ClickHouse的组成,ClickHouse由Click
和House
两个单词组成,这个在英语里面称为组合词。对于组合词,除开一些特殊情况,通常的压缩规则是,选取每个单词的首字母。
业界有很多基于这个规则的例子,比如:
- HDFS - Hadoop Distributed File System
- MR - MapReduce
- ZK - ZooKeeper
- ASF - Apache Software Foundation
- DS - DolphinScheduler
上述类似的例子数不胜数。
接下来,还有在ClickHouse源码中,官方对自己的简写称呼:
// For support old versions CH. if (source_is_lost_stat.version == -1) ... /** Considering that CH uses UInt8 for representation of boolean values this function ...
所以,ClickHouse的正确缩写,应该是 CH CH CH ,重要的事情必须说三遍。 希望大家以后不要再叫他内裤了...
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
稳定平滑进行云上业务IPv6化改造—— Series1:改造思路及CDN改造
1 背景 随着国家工信部印发的《推进IPv6规模部署行动计划》的深入推进,近期国资委相关的大型国企都开始着手进行业务的IPv6化改造,其在阿里云上的门户及B2B、B2C等对外业务,自然进入第一批改造的范围。本文是基于在具体客户的IPv6化过程中积累的最佳实践编写,希望能够给读者带来一些IPv6化改造的启发。 2 哪些业务需要进行IPv6改造? 从客户业务角度来看,客户的门户网站、ERP、CRM、生产系统等需要和外部进行业务交互的业务均需要进行IPv6化改造。将这些业务进行抽象化,其业务应用所用的ECS资源及业务应用,其文件分发所需的OSS资源、CDN资源,其业务负载分配的SLB资源,以及域名解析的DNS资源均有必要进行IPv6化改造;其内部的数据处理组件及中间件由于不会和外部直接交互故暂无IPv6化改造刚需。 图1:涉及IPv6化改造的阿里云产品 3 IPv6化改造思路 3.1 IPv6化业务改造总体原则是“对现有业务应用改动要尽可能小” 我们在帮客户进行IPv6化改造的过程中,要先设计方案、再在模拟环境验证方案,然后进行分模块的变更和验证。在进行改造的过程中,要尽一切可能不影响现有I...
- 下一篇
DB 与 Elasticsearch 混合应用之数据实时同步
作者介绍 李猛,Elastic Stack 深度用户,通过 Elastic 工程师认证,2012年接触 Elasticsearch,对 Elastic Stack 技术栈开发、架构、运维等方面有深入体验,实践过多种大中型项目;为企业提供 Elastic Stack 咨询培训以及调优实施;多年实战经验,爱捣腾各种技术产品,擅长大数据,机器学习,系统架构。 序言 前一篇文章 《DB与ES混合之应用系统场景分析探讨》,我们主要探讨了混合场景下的多种模型映射类型,基本覆盖了应用业务系统如何借助Elasticsearch 来解决DB局限性。 下面这篇文章,我们主要解决 DB 到 Elasticsearch 数据实时同步问题。 背景需求 DB与ES本质上是属于不同应用领域的数据库产品,混合应用在一起主要面临2个问题 : 1、同步实时性,数据在DB更新之后,
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Mario游戏-低调大师作品
- 2048小游戏-低调大师作品
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案