E-MapReduce大数据安全实践
E-MapReduce从EMR-2.7.x/EMR-3.5.x版本开始支持创建安全类型的集群,即集群中的开源组件以Kerberos的安全模式启动,在这种安全环境下只有经过认证的客户端(Client)才能访问集群的服务(Service,如HDFS)。
企业级安全
一个大数据集群的企业级安全,从外到内可以分为几层:
- 边界安全
如网络的隔离,使用vpc/安全组/iptables等。
- 认证(Authentication)
只有可信的得到合法身份认证的用户才能够访问集群。
开源组件通用的认证方案是集成Kerberos(如HDFS/YARN/HBase等),也有用户名/密码(如hue等)。
- 授权(Authorization)
将开源组件里面的具体资源的操作权限授予用户,未被授权的用户无法访问资源。
- 加密(Encryption)
通道/数据的加密,如HDFS存储