用集群脚本功能安装大象医生优化你的大数据作业
dr-elephant是linkedin开源的大数据作业诊断优化工具,可以读取作业的日志信息,给出可视化的问题诊断和优化建议。
本文介绍如何在emr集群上安装大象医生,并提供一个优化hive参数的完整示例。大象诊断的详情文档可以看官方文档,后续本博客也会发表一些使用经验。
注意:目前大象医生还不支持spark2,社区正在开发,敬请期待。
安装大象医生
集群脚本功能介绍
参照 集群脚本功能介绍
准备脚本
下载 脚本,放在您的oss合适的目录里。
运行脚本
本文用的示例集群是EMR3.4.2版本,3节点,4核16GB的默认配置。
- 集群列表页面点击对应集群的管理按钮
- 左侧菜单单击集群脚本,进入该集群的集群脚本执行界面
- 单击右上角创建并执行,进入创建界面。
- 选择刚才的脚本,设置名字,节点请只选择master节点,ha集群选择集群详情中第一个master节点,点击确