深度解读!时序数据库HiTSDB:分布式流式聚合引擎
背景
HiTSDB时序数据库引擎在服务于阿里巴巴集团内的客户时,根据集团业务特性做了很多针对性的优化。 然而在HiTSDB云产品的打磨过程中逐渐发现,很多针对性的优化很难在公有云上针对特定用户去实施。
于此同时, 在公有云客户使用HiTSDB的过程中,发现了越来越多由于聚合查询导致的问题,比如: 返回数据点过多会出现栈溢出等错误,聚合点过多导致OOM, 或者无法完成聚合,实例完全卡死等等问题。这些问题主要由于原始的聚合引擎架构上的缺陷导致。
因此HiTSDB开发团队评估后决定围绕新的聚合引擎架构对HiTSDB引擎进行升级,包含: 存储模型的改造,索引方式的升级,实现全新的流式聚合,数据迁移,性能评测。 本文主要围绕这5个方面进行梳理,重点在“全新的流式聚合部分”。
1. 时序数据存储模型:
1.1 时序的数据存储格式。
一个典型的时序数据由两
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里云消息队列 Kafka 公测发布
产品介绍: 消息队列 Kafka 是一个分布式的、高吞吐量、高可扩展性消息队列服务,广泛用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等大数据领域,是大数据生态中不可或缺的产品之一。 阿里云提供 Apache Kafka 全站式托管服务,彻底解决开源产品长期以来的痛点,用户只需专注于业务开发,无需部署运维,低成本、更弹性、更可靠。 适用客户: 1. 云上C类、B类用户(1. 有大数据在线/离线分析处理的需求的用户;2. Apache Kafka 的习惯用户) 2. 用户角色(有一定开发/运维能力的开发/运维人员) 发布功能: 一、消息队列 Kafka 生态: 1. 消息队列 Kafka 广泛应用于大数据领域,如网站行为分析、日志聚合、Apps监控、流式数据处理、在线和离线分析等; 2. 消息队列 Kafka 让数据集成变得
- 下一篇
Gartner报告:东方金信进入Hadoop世界厂商名录
2月1日,国际知名咨询机构Gartner发布Hadoop发行版市场指南《Market Guide for Hadoop Distribution》。东方金信作为大数据领域代表厂商,在此报告中与Cloudera、Oracle、AWS等并列提及,正式进入Gartner世界厂商名录。 作为一家专注于大数据平台和大数据解决方案的领先企业,东方金信是国内为数不多的掌握大数据核心技术的公司,拥有ISO9001和CMMI3认证,是国内首批通过工信部大数据能力认证的六家企业之一。东方金信的核心产品来自Google分布式大数据平台,涵盖大数据产业链的数据采集、数据管理、数据运算、数据分析挖掘以及数据应用的全部环节,可以为客户提供一站式的分布式大数据解决方案。目前,东方金信已在政府、金融、电信、工业、医疗等多个领域和行业实现大数据战略布局。 在过去的2016年,东方金信在行业内的影响力逐步显现。在4月工信部举办的大数据产业峰会上,东方金信代表中国大数据厂商发言,讲解大数据技术与产品创新。同时,作为中国数据中心联盟成员,东方金信参与和编写了中国大数据标准和安全纲要。在8月的中国大数据产业生态大会上,东方金信...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Hadoop3单机部署,实现最简伪集群
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7安装Docker,走上虚拟化容器引擎之路