Apache IoTDB 系列教程-6：性能优化（0.8-0.10）-低调大师

Apache IoTDB 系列教程-6：性能优化（0.8-0.10）

2020-07-14 747

今天的内容包括建模优化、读写性能优化，会涉及一些简单的原理介绍。主要面向 0.8 - 0.10 版本。

正文 3754 字，预计阅读时间 10 分钟。

建模指南

关于存储组

现在每个存储组是一个相对独立的引擎，而且读写锁是存储组级别的。因此把存储组从1改到10，读写基本能增速8倍。单个 IoTDB 实例推荐设置 CPU 核数个存储组。存储组越多，并行度就越高。我们之后打算把锁粒度下放到设备层。

设备

设备这个概念没有在 SQL 语句里显示的定义出来，而是在服务器端处理时候默认将倒数第二层设置为设备，导致大家容易忽略这个概念。先说一下设备影响什么。

（1）区分顺序数据和乱序数据是以设备为粒度的。举个例子，假如一个设备在内存里写了时间戳 1-10 的数据（不论写哪些测点，时间戳都会算到这个设备头上），落盘了，再写时间戳<=10 的数据，这些数据就会被当做乱序数据缓存并落盘。

（2）设备粒度的时间范围索引。对于每个 TsFile 文件，会构造设备粒度的索引在内存里，假如所有设备都活跃，N 个 TsFile，D 个设备，就有 N*D 条索引。百万级设备的索引内存会吃不消。这个东西我们会在一两个版本内改掉。

再说一下怎么设计建模来控制设备数。对于实际应用设备和传感器层次比较简单的情况比较好说，设备下直接是传感器层，一般不会建错。对于设备下有多层结构的就要注意了。

比如我一个设备下有10个传感器(s1,s2,...,s10)，每个传感器采集10个时间序列的数据(f1,f2,...f10)。这时候很容易建成 root.xxx.device.s1.f1 这种。当你建成这种时候，你以为的 device 就不再是你以为的 device 了，实际的device 变成了 root.xxx.device.s1 。实际 device 数量就是你以为的 10 倍了。

怎么办嘞，如果设备下的子设备不多，这样建模也没啥问题，只要你心里清楚系统中实际有多少个设备就行，这样沟通不会出现偏差，便于以后排查问题。

如果子设备非常多，可以把设备后的那几层压成一层，比如 root.xxx.device.s1_f1 。由于我们是以 . 作为分隔符的，这样 s1_f1 就变成 1 层了。实际的设备还是 root.xxx.device。

Measurement 定义

Measurement 也就是最后一层的测点。假如一个测点是 INT32 或者 INT64 类型的，而且大部分时间这个数据的值都一样，没什么变化，这时候用 RLE 编码就很好。可以大大节省磁盘空间，当然刷盘速度也会变快。压缩方式开着 SNAPPY 就挺好。

Tag & Attribute

0.10.0 引入的这两个概念，容易分不清这两个有啥区别。虽然都是 key-value 类型的属性。但是 Tag 是可以反向查询时间序列的元数据的，假如有个 tag 的 key 是 owner，就可以用 show timeseries where owner=Thanos 查灭霸拥有的时间序列。Tag 常驻内存，有Tag到时间序列的索引。

Attribute 就是普通属性了，比如有个属性是 description="this is my series"。这些属性只能是给定时间序列的路径顺带展示一下，辅助人查看的。

因此，要根据实际需求进行区分，那些需要做反向查询的属性，就建成 tag，其他的就搞成 attribute 就行了。

读写优化

读和写关系密切，数据的写入和参数配置会影响查询性能。

写入接口

以 0.10 为例，先同类比较，insertRecords 接口肯定比 insertRecord 接口要快，这个类似 JDBC 的 executeBatch 和 execute 的区别，节省了网络通信次数。同理，insertTablets 比 insertTablet 要快，createMultiTimeseries 也比 createTimeseries 要快。

进一步，insertRecords 方法我们提供了两种，一种是传 Object 的 value，一种是传 String 的 value。如果客户端能获取 value 的类型，建议用 Object 的，会比 String 的快 25% 左右。

跨类比较的话，如果不考虑客户端做格式转化的耗时，insertTablet 比 insertRecords 要快很多，可能 8 倍以上，节省了很多对象封装的耗时，batch size 1000左右就可以。

insertTablet 这个接口默认是没排序的，如果你能保证一个 Tablet 数据的时间戳是非递减的，那就可以多加一个 sorted 为 true 的参数。就节省了客户端的排序。

在统计耗时的时候，还需要注意客户端做格式转化的耗时，可以把接口参数构造的时间和执行的时间分开统计。

查询接口

查询接口比较简单，Session 默认的 hasNext 和 next 会返回 RowRecord 结构，这个结构不一定大家都需要，可以用 SessionDataSet 的 iterator 得到一个迭代器，然后通过类似 JDBC 的接口去得到原始数据，避免很多没用的对象生成。

顺序写入

对于时序数据库，时序是一个很重要的概念，最好不要乱来。IoTDB 支持数据的乱序写入，但是乱序数据会影响查询性能，主要是对于聚合查询，原理是乱序数据会让预计算的统计信息失效，把聚合查询降维打击到读原始数据。

正常情况下，有个几倍的乱序都没问题，但是如果往一个时间段写入了过多（几万倍）的乱序数据，查询时候有可能爆内存。举个例子，内存缓冲区写了时间戳1-10的数据落盘了，然后又写了 9999 遍 1-10 的缓冲区，这样磁盘上就有 1 万个时间戳是 1-10 的数据块。查询时候需要将 1万个数据块都读出来进行合并，内存占用就比较大了。

面对这种场景，我们会后台做数据整理来处理乱序（在0.9引入的merge，但是0.9版本有bug，0.10修掉了，但是先默认关掉了，会在0.11重新开放merge），但是如果能在客户端避免乱序，就尽量写入的时候避免掉。一个设备就按递增的顺序写入。

如果前边接了 kafka，最好注意一下，把设备 id 作为分区粒度，这样一个设备的数据都会发送到一个分区里，消费的时候同一个分区也能保证顺序。

内存缓冲区

先介绍一下每个序列在内存里能缓存多少个点的怎么算的，用 memtable 大小除以序列数，再除以每个点的大小，比如long类型就是 16字节（8字节时间戳，8字节值），float是12字节。

memtable 的大小可以从日志里看到，搜 reaches，大概日志就是 the memtable size xxx reaches the threshold。如果配置文件里的 enable_parameter_adapter 没有改为 false，这个 memtable 大小就不固定，随着注册的序列数量调整的。

内存缓冲区在一定范围内尽可能大有利于读写。平均每个序列能缓冲100万点以下是比较好的。但是不建议太大，查询时候会临时排序，如果内存中数据点过多，比如千万级，查询时候内存排序会占个十几秒。

为了避免这个问题，0.10.0 里加了个参数，avg_series_point_number_threshold ，默认是 10000，也就是内存缓冲区中每个序列最多缓存这么多点就会刷盘，这个默认参数没给好，可以改成50万或者100万。

memtable_size_threshold 这个参数越大，写入速度快，一般在几百M到一两G左右。不要设置的过小，比如几M，会严重影响写入速度。在设置这个参数时候需要注意不要超内存限制，调这个参数之前需要保证 enable_parameter_adapter 改为 false。

多数据目录

数据库的瓶颈在磁盘IO，简单的提升磁盘IO能力的就是配置多盘。IoTDB 的数据目录可以在 data_dirs 参数配置，用逗号分隔多个目录。可以每块盘一个目录。在写数据的时候会到这几个盘里找最空闲的写。

客户端优化

刚才说了存储组级别的锁，对于同一个存储组的N个写线程，这N个写线程都会抢一把锁，一个存储组对应不超过50个客户端比较好，写线程过多会导致过多的锁竞争。

线程池 SessionPool 的容量，一般搞个服务器 CPU 核数就可以了，不要过多。

客户端的内存，数据的生产和消费速率也可以监控起来，避免提交的任务积压过多，如果客户端内存满了，会出现一个现象：客户端发送请求到服务器，服务器执行和返回很快，但是客户端接收结果会很慢。

容易爆内存的点

select * from root 这个语句在序列过多时候最好不要做，这个操作会把整个库当做一张表，一下查出来所有列的一批数据，容易爆内存，我们会在0.11版本加个检查，及时拒绝。

show timeseries 在 0.10 及以前的版本会把系统所有序列在内存里拷贝一遍传给客户端，如果序列过多，最好指定前缀做个过滤。或者 show child paths 一层一层往下查。

时间序列过多（亿级），元数据可能爆内存，可以按照一条时间序列 200字节估计一下，大概1千万序列会占2G元数据（就是那个元数据树）。

总结

数据库前期需要比较多的手动调优，现在的自动调优工具还有待完善，我们的目标是越简单越好，0.11 版本会完善内存和参数配置。今天内容比较多，之后想到什么再出续集！

欢迎关注，转发，给 github 点 star！

https://github.com/apache/incubator-iotdb/tree/master

微信关注我们

原文链接：https://my.oschina.net/u/3664598/blog/4371690

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

一篇文章带你快速理解springcloud微服务架构

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！ SpringCloud微服务微服务的模式和形式我在前面已经进行部分的提及，但是一直没落实到技术层面，这段时间我也在次研究了一下微服务，下面我先贴出SpringCloud整体涉及的结构：上面展示的这些是SpringCloud整体的结构先对这些空间做一个初步的介绍： Ribbon，客户端负载均衡，重试机制。 Hystrix，客户端容错保护，服务熔断、请求缓存、请求合并、依赖隔离。 Feign，声明式服务调用，本质上就是Ribbon+Hystrix（优化代码，避免直接使用RestTemplate的混乱）Bus，消息总线，配合Config仓库修改的一种Stream实现，独自启动不需要依赖其它组件。 Eureka，服务注册中心，特性有失效剔除、服务保护。 Dashboard，Hystrix仪表盘，监控集群模式和单点模式，其中集群模式需要收集器Turbine配合。Zuul，API服务网关，功能有路由分发和过滤。还有其它服务空间，包括configuration等等那么什么是注册中心呢？注册中...

2020-07-13

659

近期，国内智慧城市建设持续加速，多个项目招标落地。近年来，国内云计算大厂华为云在智慧城市领域一路乘风破浪，连续在安徽六安、福州仓山、贵州铜仁、深圳龙岗等地斩获大单。安徽省六安市“新型智慧城市建设云服务”采购项目标的信息：福州市仓山区“人工智能云服务”采购项目标的信息：铜仁市智慧城市云计算服务采购项目中标信息：深圳市智慧龙岗2.0项目中标信息：随着全球数字经济的高速扩张，作为数字经济发展的主阵地，城市要如何应用大数据、云计算、人工智能等技术，提升城市治理能力、产业发展潜力，成为国家下一部发展的重要布局。尤其是年初以来，在疫情的冲击下，数字化发展好的城市往往有更高的复工复产能力和灵活应变能力。而经过一段时间的探索之后，国内诸多城市开始从数字化走向智能化、智慧化，这也是今年以来中央着重强调的“运用信息化让城市变得更‘聪明’”。多重背景影响下，无论是走在数字化发展前列的北上广深等地区，还是贵州、福建这样的后起之秀，都开始积极寻求智慧化城市建设之道。对此，华为云根据各地区、各城市的产业类别、实际需求不同，为其量身打造了适配程度高的智慧城市体系。以安徽六安为例，2020年六安市政...

2020-07-14

721

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。