解读数仓中的数据对象及相关关系-低调大师

解读数仓中的数据对象及相关关系

2022-12-02 467

摘要：为实现不同的功能，GaussDB（DWS）提供了不同的数据对象类型，包括索引、行存表、列存表及其辅助表等。这些数据对象在特定的条件下实现不同的功能，为数据库的快速高效提供了保证，本文对部分数据对象进行介绍。

本文分享自华为云社区《GaussDB（DWS）之数据对象及相互关系总结》，作者：我的橘子呢。

为实现不同的功能，GaussDB（DWS）提供了不同的数据对象类型，包括索引、行存表、列存表及其辅助表等。这些数据对象在特定的条件下实现不同的功能，为数据库的快速高效提供了保证，本文对部分数据对象进行介绍。

1.索引（index）

索引是关系型数据库中对某一列或者多个列的值进行预排序的数据结构。如果数据库的记录非常多，通过建立索引可以获得非常快的查询速度，当对某一列建立索引之后，通过该列进行相关查询时数据库系统就不必扫描整个表，而是直接通过索引定位到符合条件的记录，在一定程度上能够大幅提升查询得速度。

假如需要执行如下的语句进行查询：

SELECT name FROM test_1 WHERE number =10；

一般情况下数据库需要对每一行进行遍历查询，直到找到所有满足条件number=10的元组信息。当数据库的记录很多，而满足where条件的记录又很少时，顺序扫描的性能就会很差。这时如果在表test_1的number属性上建立索引，用于快速定位需要匹配的元组信息，数据库只需要根据索引的数据结构进行搜索，由于常用的索引结构有B-Tree、Hash、GiSt、GIN等，这些索引结构的查询都是快速高效的，因此可以在少数几步内完成查询，大大提高了查询效率。

对表test_1的number属性建立索引语句如下：

CREATE INDEX numberIndex ON test_1（number）；

由于GaussDB里的所有索引都是“从属索引”，索引在物理文件上与原来的表文件分离，执行上述创建索引语句后，系统会生成relname为numberIndex的索引类型。表和索引都是数据库对象，在pg_class里会有该索引的记录，有与之相对应的oid，同时在pg_index表里会记录索引及其对应主表的信息。对应属性信息如图1所示。

图1 pg_index部分属性

2.toast表

toast（The Oversized-Atttibute Storage Techhnique）即超尺寸字段存储技巧，是数据库提供的一种存储大数据的机制。只有一些具有变长表现形式的数据类型才会支持toast，比如TEXT类型。由于在GaussDB(DWS)的行存储方式中，一条数据的所有列组合在一起称之为一个tuple，多个tuple组成一个page。page是数据在文件存储中的基本单位，其大小是固定的且只能在编译器指定，之后无法修改，默认发大小为8KB，当某行数据很大超过page的大小时，数据库系统就会启动toast，对数据进行压缩和切片。实际数据以行外存储的形式存储在另外一张表中，这张表就是toast表。

当一张表的任何一个属性是可以toast的，则这张表会有一张关联的toast表，在pg_class里表的reltoastrelid属性里记录了该toast表的oid，如果没有关联的toast表，reltoastrelid=0。那么如何判断一张表的属性是否是可以toast的呢？我们可以在表的Storage选项中查看对应属性的存储策略。有以下四种不同的存储策略：

PLAIN：避免压缩或者行外存储；此外，它禁止为变长类型使用单字节的头。这只对那些不能TOAST的数据类型的列才有可能。
EXTENDED：允许压缩和行外存储。这是大多数TOAST数据类型的缺省策略。首先会尝试对数据进行压缩，如果行仍然太大，则进行行外存储。
EXTERNAL：允许行外存储，但是不许压缩。使用EXTERNAL，将使那些数据类型为text和bytea的字段上的子字符串操作更快 (代价是增加了存储空间)，因为这些操作是经过优化的：如果行外数据没有压缩，那么它们只会获取需要的部分。
MAIN：允许压缩，但不允许行外存储。实际上，在这样的字段上仍然会进行行外存储，但只是作为没有办法把数据行变得更小以使之足以放置在一个页面中的最后选择。

假如创建表语句如下：

CREATE TABLE test_t(id int,description text);

创建了一张test_t表，该表有id和description两个属性，分别属于int和text类型，查看该表的属性对应的Storage策略：

图2 test_t表相关信息

我们可以看出description属性的Storage策略为EXTENDED，是可以toast的，系统会为test_t表创建一张关联的toast表。

图3 test_t表对应toast表

通过查询pg_class，可以的看到表test_t关联的toast表的oid为52579，进一步以此oid为条件在pg_class里就会得到toast表的相关信息。

图4 toast表相关信息

下图为test_t表和其对应的toast表之间的关系，以及toast表一些基本属性的介绍。

图5 test_t与其toast表关系图

3.cudesc表

GaussDB(DWS)除了提供行存储方式外，还支持列存储方式。列存储方式在数据压缩、列批量数据的运算、大数据统计分析等场景中有着显著的优势。CU（Compress Unit）压缩单元是列存储的最小单位，每列默认60000行存储在一个CU中，CU生成后数据固定不可更改。CUDesc本身是一张行存表，它用来辅助记录列存表的cu信息，该表的每一行描述一个CU，包括最大值最小值以及CU在文件中的偏移量和大小，连续多个行中各个不同的列的cu_id相同，可以认为就是把连续多个行截断拿出来，然后再根据不同的列，放到不同的cu中，这些CU所在的行数都是一致的，用一个cu_id表示，但是col_id不一样。同时还增加了一个col_id=-10的列，这个列为VCU，表示这些连续的行中，有哪些行已经是被删除了，用delete_map记录删除信息。如图6所示。

图6 cudesc表示意图

每张列存表都有一张对应的CUDesc表，CUDesc表的oid可以在pg_class中对应列存表元组的relcudescrelid属性中查到，所有CUDesc表默认存储在namespace oid = 100，name为cstore的namespace下。

4.delta表

在列存储方式中，无论是向列存表中插入1条还是60000条数据，都只会生成一个CU，在多次插入少量数据时，不能有效的利用列存压缩能力，导致数据膨胀影响查询的性能和磁盘使用率。CU只支持追加写的方式，也就是说，后面对这个CU中的数据做更新或删除都不会真正更改这个CU，删除是将老数据在字典中标记为作废，更新操作是标记老数据删除后，再写入一条新记录到新CU，原来的CU不会有任何的修改。

从这里我们可以看出，在对列存表进行多次更新/删除，或每次只插入很少量的数据后，会导致列存表空间膨胀，大量空间无法有效利用，这是因为列存表在设计上就是为了大批量数据导入以及海量数据按列存储/查询。Delta表正是为了解决这两个问题。在启用delta表后，单条或者小批量数据导入时，数据将进入delta表中，避免小CU的产生，delta表的增删改查与行存表一致。开启delta表后，将显著提升列存表单条导入的性能。

delta表同样是一张行存表，为了辅助列存表而存在。在创建列存表时系统会为该列存表创建一张对应的delta表，delta表的oid可以在pg_class中对应列存表元组的reldeltarelid属性中查到，所有delta表也默认存储在namespace oid = 100，name为cstore的namespace下。

创建一张列存表col_test，同时设置reloption属性enable_delta=true。在pg_class中查看该表对应的delta表oid。

图7 创建列存表并开启delta表

进一步根据该oid信息可以查到delta表的对应信息。

图8 查询delta表相关信息

可以指定reloption选项设置是否为该列存表开启delta表：

图9 开启/关闭delta表操作

5.分区表

分区表就是把逻辑上的一张表根据某种方案分成几张物理块进行存储。这张逻辑上的表称之为分区表，物理块称之为分区。分区表是一张逻辑表，不存储数据，数据实际是存储在分区上的。分区表的定义不难理解，下面我们通过一个例子说明分区表的用法。

创建一张有id和name两个属性的分区表part_test，该表以id的大小进行分区，其中id<10的数据存储在分区location_1，10≤id<20的数据存储在分区location_2，所有id≥20的数据存储在分区location_3。

CREATE TABLE part_test(id int,name text) partition BY range(id) (partition locatition_1 values less than (10),partition locatition_2 values less than (20),partition locatition_3 values less than (maxvalue));

创建好part_test表后，我们所有的增删改查都是直接对part_test表操作的，对用户操作来说part_test表与普通表没有什么区别，但实际的存储方式却是严格按照分区的划分方式进行存储的，数据存储在各个分区上，part_test表作为一张逻辑表不保存数据。我们可以通过pg_partition这张系统表查询到一张分区表的分区信息。

图10 part_test表分区信息

分区表和分区的关系如图所示：

图11 分区表和分区关系图

6.各类表相关对象总结

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/5602886

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

作者：阿里云智能技术专家周康，StarRocks Active Contributor 郑志铨（本文为作者在 StarRocks Summit Asia 2022 上的分享）为了能够满足更多用户对于极速分析数据的需求，同时让 StarRocks 强大的分析能力应用在更加广泛的数据集上，阿里云EMR OLAP 团队与 StarRocks 社区在 2021 年就开始合作。双方联手增强 StarRocks 的数据湖分析能力，使其不仅能够分析存储在 StarRocks 本地的数据，还能够以同样出色的表现分析存储在 Apache Hive（以下简称 Hive）、Apache Iceberg（以下简称 Iceberg）和 Apache Hudi（以下简称 Hudi）等开源数据湖或数据仓库的数据。阿里云EMR StarRocks 正是 StarRocks 授权阿里云的一款开源 OLAP 产品，致力于构建极速统一分析体验，满足企业用户的多种数据分析场景。本文将主要阐释阿里云EMR StarRocks 在数据湖方向已经做过的工作、实际的效果体现，以及 StarRocks 在数据湖分析方向的规划。...

2022-12-02

468

Hexo 是一个快速、简单且功能强大的博客框架。使用 Markdown 解析文档，Hexo 能在几秒内生成带有自定义主题并集成各项功能的网站页面。本文采用 Github Pages + Hexo 的方式，搭建个人博客。零、准备工作 1. 使用个人 GitHub 创建仓库，并配置 GitHub Pages 注意: 此仓库用于存放个人博客页面，仓库名必须使用 <GitHub用户名>.github.io 格式。仓库创建完成后，可以在仓库根路径下创建一个名为 index.html 的静态 HTML 文件来验证个人博客搭建是否成功。 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Someone's Blog</title> </head> <body> <h1>Hello, Blog World ~</h1> </body> </h...

2022-12-02

515

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。