hive在E-MapReduce集群的实践(二)集群hive参数优化
本文介绍一些常见的集群跑hive作业参数优化,可以根据业务需要来使用。
提高hdfs性能
修改hdfs-site,注意重启hdfs服务
dfs.client.read.shortcircuit=true //直读
dfs.client.read.shortcircuit.streams.cache.size=4096 //直读缓存
dfs.datanode.balance.bandwidthPerSec=30048576 //提高balance带宽,一般扩容后调整
dfs.datanode.max.transfer.threads=16384 //提高线程数
dfs.namenode.checkpoint.period=21600 //延长checkpoint时间
dfs.namenode.handler.count=100 //并发数,大集