关于Hive中的复杂数据类型Array,Map,Structs的一些使用案例
写在前边的话: 同样是在做豆瓣电影数据分析的小课题的时候遇到的一个问题:hive表中的电影类型存储格式为array,那么我如何针对每一个类型做统计呢? 本来是想在基于豆瓣电影数据进行相关的数据分析项目 中进行相关解释说明的,仔细想了下,刚好拿出来,对hive的三个复杂数据类型做一个总结性的学习 关于Hive的一些其他数据类型使用参考:Hive的数据类型解析和表的操作实例 1:Array 顾名思义就是数组,使用方式 array<> 1):创建表 拿电影数据为例,数据的维度包括 创建movie_message表: create table movie_message( id int, title string, daoyan array<string>, bianju array<string>, leixing array<string>, zhuyan array<string>, year int, month int, shichang int, disnum int, scor...