Apache IoTDB 建模方式详解-低调大师

Apache IoTDB 建模方式详解

2020-11-29 680

之前写过一个 IoTDB 数据模型的介绍，但是实际例子举得不多，所以部分用户对于一个实际系统如何建模还比较困惑，今天主要介绍一下建模实例。

正文 1852 字，预计阅读时间 5 分钟。

标签模型

实时库、InfluxDB、OpenTSDB等多是基于标签的模型。

在实时库中，每个测点有一个名称（可以看成一个标签）。通常这个测点名称是由符号 “.” 连接的多个属性值。在一个电厂应用的命名示例是这样的：电厂名称.机组.测点编码。如果将实时库中的所有测点的数据理解成一张表，就是下边这样的：

这个表里，Time 和测点名称就是联合主键。

在 InfluxDB、OpenTSDB 中每条数据有 tag 和 field 的概念，上面的数据通常会被定义为 3 个 tag 和 1 个 field，查询出来的表结构是这样的：

这个表里，Time 和所有 tag 列是联合主键。

树形数据模型

IoTDB 中的数据模型是什么样的呢？

先介绍一下 IoTDB 对时间序列的定义：一个测点在不断地采集数据，每个数据点会打上一个时间戳，这个测点的数据就对应一条时间序列，一条时间序列举例如下：

IoTDB 的目标场景就是管理很多这种时间序列，各个时间序列是由路径唯一定位的。上一节中的数据对应到 IoTDB 中就是 3 个时间序列，3个时间序列的路径如下：

root.TC.N1DCS.POINT1root.TC.N1DCS.POINT2root.HM.DCS1.POINT3

这些路径形成了一棵树形的元数据结构：

其中从 root 到倒数第二级的路径在 IoTDB 中有个特殊的含义：设备，这个例子中有两个设备：root.TC.N1DCS，root.HM.DCS1。

同一设备的多个测点可以共享一个时间戳写入：

insert into root.TC.N1DCS(time, POINT1, POINT2) values(1606377709000, 0.074767, 11.026245)insert into root.HM.DCS1(time, POINT3) values(1606377709000, 0.0)

标签模型与树形模型的对应关系

Tag 的值形成了树形结构的路径，是元数据树上的一个节点（避免把 Tag 的名称定义为一个时间序列，Tag 值存储成了这个时间序列的值）。

比如，在IoTDB 中，建立了以下两条时间序列（root.sg.taga, root.sg.value），并用来存储多个测点（a1, b1, c1）的值，这种就是错误的建模方式，这种情况下，同一个时间序列的同一个时间戳只保留最后写入的点，所以第 3 行蓝色的数据会被第 4 行覆盖掉。

对于这种情况，正确的建模方式是创建 3 条时间序列

root.sg.a1, root.sg.b1, root.sg.c1

这种情况下，3 条序列的数据分别为：

Time	root.sg.a1
1	1.23
2	2.31

Time	root.sg.b1
3	1.4

Time	root.sg.c1
3	1.5

查询

以第一节的数据为例来介绍一下 IoTDB 的查询。首先根据 select 和 from 子句中的路径找到所有匹配到的时间序列，然后按照不同的对齐方式展示成一张表，这里提供了 3 种对齐方法。

（1）按照 Time 对齐（默认）

如查询 TC 下的所有测点的数据，以 root.TC 为前缀匹配到了 2 个序列

以 root.* 为前缀可以匹配 3 个序列

（2）按照设备表展示，按照 Time 和 device 对齐，可以用 align by device 语句，对齐后为空的就展示 null

（3）不对齐，每个时间序列独立展示。每个时间序列有两列（时间列和值列），使用 disable align 修饰，这里其实是有3个表，每个表中应该空一些。

总结

树形模型比较灵活，比如一个电厂有 3 个设备，每个设备的发电量是一个时间序列。我们会创建 3 个序列：root.电厂1.设备1.发电量，root.电厂1.设备2.发电量，root.电厂1.设备3.发电量。现在希望增加一个电厂总发电量，就可以在电厂下一级增加一个时间序列：root.电厂1.总发电量。

也有一些时序数据库采用关系模型，像 TimescaleDB，关系模型的好处是学习成本低，适用于数据较为规整的场景，但是表需要提前定义，修改（加列）的代价比较大，不适用预先不确定有多少测点，或一个设备的多个测点不同时采集的场景。

没有一种结构适用于所有场景，我们之后会逐渐让元数据模型更简单，降低学习成本。最后，欢迎大家加入社区一起交流~

QQ 群：659990460

微信群：添加好友 tietouqiao

Github：https://github.com/apache/iotdb

本文分享自微信公众号 - IoTDB漫游指南（Apache-IoTDB）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/3664598/blog/4759767

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

🎉 Element UI for Vue 3.0 来了！

第一个使用 TypeScript + Vue 3.0 Composition API 重构的组件库 Element Plus 发布了 🎉 ~ 2016 年 3 月 13 日 Element 悄然诞生，经历了 4 年的风雨洗礼，我们从一个饿了么内部业务组件库成长为 Vue 生态里最流行的 UI 组件库之一截至本文撰写时，Element 已获得 48200 Github Star，NPM 下载量 95 万次/每月的可喜成绩。感谢超过 530 名社区贡献者的参与维护，和我们一同完成了 4400 次 commit 的更新迭代。 *Element 开发团队 40000 Github Star 庆祝会 Element Plus for Vue 3.0 2020 年，随着 Vue 3.0 不断完善和发布，我们也紧张投入到 Element 对 Vue 3.0 的升级适配工作中。历经 6 个月共计 23 个 alpha 版本的迭代，终于，在今天， Element Plus for Vue 3.0 Beta 版本正式发布 🎊 ！ https://github.com/element-plus/ele...

2020-11-30

568

摘要：想了解深度学习却又无从下手，不如从手写数字识别模型训练开始吧！深度学习作为机器学习分支之一，应用日益广泛。语音识别、自动机器翻译、即时视觉翻译、刷脸支付、人脸考勤……不知不觉，深度学习已经渗入到我们生活中的每个角落，给生活带来极大便利。即便如此，依然有很多人觉得深度学习高深莫测、遥不可及，的确，它有深奥之处，非专业人士难以企及，但也有亲和力十足的一面，让没有基础的小白也能轻松上手，感受深度学习的魅力，接下来要介绍的手写数字识别模型训练正是如此。手写数字识别初探手写数字识别是计算机视觉中较为简单的任务，也是计算机视觉领域发展较早的方向之一，早期主要用于银行汇款、单号识别、邮政信件、包裹的手写、邮编识别等场景，目前手写数字识别已经达到了较高的准确率，得到大规模的推广与应用。虽然手写数字识别本身的领域比较狭窄，实用性有限，但是在它基础上发展起来的卷积神经网络等计算机视觉技术早已应用在更为复杂的任务中，因此，手写数字识别也成为计算机视觉领域衡量算法表现的一个基准任务。所以，通过这一实践场景来了解神经网络开发和训练，可谓再好不过了。如何使用深度学习框架MindSpore进行模型开发与...

2020-11-30

658

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。