Hive笔记
一、概述 1.1 简介 (1)Hive提供了一个被称为Hive查询语言(简称HiveQL或HQL)的SQL语言,来查询存储在HDFS中的结构化数据文件,它把HQL语句的查询转换为MapReduce任务。 (2)Hive应用场景: a、数据仓库:数据抽取、数据加载、数据转换 b、数据汇总:每天/每周用户点击数、流量统计 c、非实时分析:日志分析、文本分析 d、数据挖掘:用户行为分析、兴趣分区、区域展示 1.2 架构 hive是典型C/S模式,Client端有JDBC/ODBC Client和Thrift Client两类。Server端则分为如下几个部分: CLI: CLI是和Hive交互的最简单/最常用方式,你只需要在一个具备完整Hive环境下的Shell终端中键入hive即可启动服务。 Thrift Server: Hive Thrift Server是基于Thrift 软件框架开发的,它提供Hive的RPC通信接口。目前的HiveServer2(HS2)较之前一版HiveServer,增加了多客户端并发支持和认证功能,极大地提升了Hive的工作效率和安全系数。 Metast...