使用Ranger对Hive数据进行脱敏
Ranger支持对Hive数据的脱敏处理(Data Masking),它对select的返回结果进行脱敏处理,对用户屏蔽敏感信息。
备注:
该功能针对HiveServer2的场景(如beeline/jdbc/Hue等途径执行的select),对于使用Hive Client(如hive -e 'select xxxx')不支持。
接下来介绍如何在E-MapReduce中使用该功能的步骤。
1.Hive组件配置Ranger
参见文档: Enable Hive Ranger Plugin
2. 配置Data Mask Policy
在Ranger UI的emr-hive的service页面可以对用户访问Hive数据进行脱敏处理。
- 支持多种脱敏处理方式,比如显示开始的4个字符/显示最后的4个字符/Hash处理等
配置Mask Policy时不支持通配符(如