0003-如何在CDH中使用LZO压缩
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 1.问题描述 CDH中默认不支持Lzo压缩编码,需要下载额外的Parcel包,才能让Hadoop相关组件如HDFS,Hive,Spark支持Lzo编码。 具体请参考: https://www.cloudera.com/documentation/enterprise/latest/topics/cm_mc_gpl_extras.html https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_gpl_extras.html#xd_583c10bfdbd326ba-3ca24a24-13d80143249--7ec6 首先我在没做额外配置的情况下,生成Lzo文件并读取。我们在Hive中创建两张表,test_table和test_table2,test_table是文本文件的表,test_table2是Lzo压缩编码的表。如下: 通过beeline访问Hive并执行上面命令: 查询test_table中的数据: 将test_ta...







