hiveql函数笔记(二)
1、数据查询 //提高聚合的性能 SET hive.map.aggr=true; SELECT count(*),avg(salary) FROM employees; //木匾不允许在一个查询语句中使用多于一个的函数(DISTINCT。。。)表达式 SELECT count(DISTINCT symbol) FROM stocks; 表生成函数: explode(APPAY array)返回0到多行结果,每行都对应输入的array数组中的一个元素 explode(ARRAY<TYPE> a)对于a中的每个元素,explode()会生成一个记录包含这个元素 explode(ARRAY<TYPE> a)对于a中的每个元素,explode()会生成一行记录包含这个元素 inline(ARRAY<STRUCT[,STRUCT]>)将结构体数组提取出来并插入到表中 json_tuple(STRING jsonStr,p1,p2,..,pn)对输入的JSON字符串进行处理,合格get_json_object这个UDF类似,不过更高效,其通过一次调用就可以获取...