Hive的HQL(2)-低调大师

Hive的HQL(2)

2016-04-16 608

Hive的HQL(2)

1. HQL的数据定义，HQL是一种SQL方言，支持绝大部分SQL-92标准。但是和SQL的差异为：不支持行级别的操作，不支持事务等。HQL的语法接近于MySQL。

2. Hive的数据库，本质仅仅是个表的目录或者命名空间。一般用数据库将生产表组织成逻辑组。

3. Hive中的表–管理表，创建表时未指定的话为默认为管理表。当删除管理表时，Hive将删除管理表中的数据和元数据。

CREATE TABLE IF NOT EXISTS test.student (
name    STRING COMMENT 'student name',
age     INT COMMENT 'student age',
cource  ARRAY<STRING>,
body    MAP<STRING,FLOAT>,
address STRUCT<STRING,CITY:STRING,STATE:STRING>)
COMMENT 'the info of student'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
COLLECTION ITEMS TERMINATED BY '\002'
MAP KEYS TEMINATED BY '\003'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/user/hive/warehouse/test.db/student';

COMMENT注释作用
ROW FORMAT DELIMITED等指定数据格式和文件存储格式。
LOCATION子句指定该表的存储位置，若不写存储在Hive默认的数据仓库目录中。

4. Hive中的表–外部表，当数据需要被多个工具（如Pig、Hive）共享时，创建一个外部表明确数据的所有权，Hive只会删除该表的元数据信息，而不会删除该表的数据。

CREATE EXTERNAL TABLE IF NOT EXISTS test.student(
name STRING COMMENT,
age INT COMMENT,
cource ARRAY<STRING>,
body MAP<STRING,FLOAT>,
address STRUCT<STREET:STRING,CITY:STRING,STATE:STRING>)
LOCATION '/user/test/x'

EXTERNAL TABLE 创建一个外部表

5. Hive中的表–分区表（partition），分区表可以进行水平切分，将表数据按照某种规则进行存储。

CREATE TABLE student_info(
student_ID STRING,
name STRING,
age INT,
sex STRING,
father_name STRING,
mother_name STRING)
PARTITIONED BY (province STRING,city STRING);

PARTITIONED BY 子句指定表按照学生家庭住址的city和province字段进行分区。
/user/hive/warehouse/student_info/province=hebei/city=handan
分区的作用相当和索引类似。
Hive安全措施，设置“strict”模式，这样如果针对一个分区表的查询没有对分区进行限制的话，改作业将会被禁止提交。
单独为外部表的分区指定值和存储位置

ALTER TABLE student_info ADD PARTITION (province = hebei,city = handan) LOCATION 'hdfs://master:9000/student/hebei/handan'

外部分区表被删除，数据不会被删除。

6. 删除表 DROP TABLE test 或者 DROP TABLE IF EXISTS test

7. 修改表

表重命名 ALTER TABLE test RENAME TO test2
增加、修改、删除分区
- 增加分区 ALTER TABLE test ADD PARTITION (x = x1, y = y2) LOCATION ‘/user/test/x1/y1’
- 修改分区 ALTER TABLE test ADD PARTITION (x = x1, y = y2) SET LOCATION ‘/user/test/x1/y1’
- 删除分区 ALTER TABLE test ADD DROP PARTITION (x = x1, y = y2)
修改列信息
ALTER TABLE test
CHANGE COLUMN id uid INT
COMMENT ‘the unique id’
AFTER name;
增加列
ALTER TABLE test ADD COLUMNS (new_col INT, new_col2 STRING);
删除或者替换列
ALTER TABLE test REPLACE COLUMNS (new_col INT, new col2 STRING);

8. HQL的数据操作 LOAD DATA

微信关注我们

原文链接：https://yq.aliyun.com/articles/70628

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive基础(1) Hive的HQL(2) 1. Hive并不是分布式的，它独立于机器之外，类似于Hadoop的客户端。 2. 元数据和数据的区别，前者如表名、列名、字段名等。 3. Hive的三种安装方式内嵌模式，元数据服务和Hive服务运行在同一个JVM中，同时使用内嵌的Derby数据库作为元数据存储，该模式只能支持同时最多一个用户打开Hive会话。本地模式，元数据服务和Hive服务运行在同一个JVM中，采用了外置的MySQL作为元数据存储，该种方式支持多个用户同时访问Hive。远程模式，元数据服务和Hive服务运行在不同的进程内，这样做的好处是，数据库层可以完全地置于防火墙之后，客户端则不需要数据库验证。推荐，生产环境中，使用本地模式、远程模式。 4. Hive不支持行级别的更新、插入或者删除操作，并且不支持事物。Hive不能做OLTP的“联机”部分，所以对Hive更适合离线计算，对于实时性要求很高的可以选择HBase或者Impala。 5. Hive和关系型数据库的区别 compare Hive RMDBS 查询语言 HQL SQL 数据存储位置 HDFS Raw De...

2016-04-17

631

Sqoop基础学习(1)

1. Sqoop的导入过程在开始导入之前，Sqoop会通过JDBC来获得所需要的数据库元数据 1.导入表的列名、数据类型等； 2.接着这些数据库的数据类型(varchar、number等)会把映射成Java的数据类型(String、int等)，根据这些信息，Sqoop会生成一个与表名同名的类用来完成反序列的工作，保持表中的每一行记录； 3.Sqoop启动MapReduce作业 4.启动的作业在input的过程中，会通过JDBC读取数据库表中的内容； 5.这是会使用Sqoop生成的类进行反序列话 6.最后再将这些记录写到HDFS中，在写入HDFS的过程中，同样会使用Sqoop生成的类进行序列化。 2. Sqoop的导出过程 1/2 Sqoop根据目标表的结构会生成一个Java类 3.该类作用为序列化和反序列化 4.接着启动一个MapReduce作业 5.在作业中会生成的Java类从HDFS中读取数据 6.并生成一批INSERT语句，每条语句都会向MySQL的目标表中插入多条记录

2016-04-17

613

资源下载

更多资源

优质分享Android(本站安卓app)

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

Hive的HQL(2)

Hive基础(1)

Hive的HQL(2)

1. HQL的数据定义，HQL是一种SQL方言，支持绝大部分SQL-92标准。但是和SQL的差异为：不支持行级别的操作，不支持事务等。HQL的语法接近于MySQL。

2. Hive的数据库，本质仅仅是个表的目录或者命名空间。一般用数据库将生产表组织成逻辑组。

3. Hive中的表–管理表，创建表时未指定的话为默认为管理表。当删除管理表时，Hive将删除管理表中的数据和元数据。

4. Hive中的表–外部表，当数据需要被多个工具（如Pig、Hive）共享时，创建一个外部表明确数据的所有权，Hive只会删除该表的元数据信息，而不会删除该表的数据。

5. Hive中的表–分区表（partition），分区表可以进行水平切分，将表数据按照某种规则进行存储。

6. 删除表 DROP TABLE test 或者 DROP TABLE IF EXISTS test

7. 修改表

8. HQL的数据操作 LOAD DATA

Hive基础(1)

Sqoop基础学习(1)

相关文章

发表评论

资源下载

优质分享Android(本站安卓app)

Oracle Database，又名Oracle RDBMS

Apache Tomcat7、8、9（Java Web服务器）

Sublime Text 一个代码编辑器

欢迎您！