JobTracker Memory Leak-低调大师

JobTracker Memory Leak

2017-11-06 666

前阶段发生过两次JT（CDH4.2.0） OOM的问题，导致ETL过程出错；由于是刚接手的集群参数大多是默认的，修改了JT的JVM参数相关的CMS，同时减小了retireJob的interval和cachesize看看是否奏效.发现过了三天又开始报警了，查看监控看到Old gen一直在涨根本释放不掉,估计是memory leak，做个内存dump分析吧（10GB的heap size），做了两次dump发现FileSystem$Cache部分一直在涨：

Google了一下果然找到了相关的Bug：https://issues.apache.org/jira/browse/MAPREDUCE-5351；解决方案主要：

1.监控JT，符合一定阈值重启

2.修改如下参数，并写脚本手动清理job file

<name>keep.failed.task.files</name>

</property>

<name>keep.task.files.pattern</name>

<value>buhuibeipipeidaodezhengzebiaodashi</value>

</property>

不过方法2在kerboros环境下有个bug: https://issues.apache.org/jira/browse/MAPREDUCE-5047，最终采取了方案1

本文转自MIKE老毕 51CTO博客，原文链接：http://blog.51cto.com/boylook/1298929，如需转载请自行联系原作者

微信关注我们

原文链接：https://yq.aliyun.com/articles/476866

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MapReduce原理及实例分析

前言由于最近开始涉及MR程序的编写，之前会一点HIVE，对MR接触不多，不论从原理还是实际操作上，都有些障碍，终于在今天柳暗花明，将这一过程记录下，与大家分享~ 环境准备在VM上搭建好LINUX虚拟机，并安装配置好HADOOP2.2.0，我这里是单节点的伪分布式在eclipse中安装hadoop插件对我们这种MR的新手而言，最好在本地有一个HADOOP运行环境，这样有许多好处：如果我们每次写完MR程序，都打成JAR包上传至线上服务器上运行，那么每次MR运行的时间非常长，也许等待了许久，运行结果和我们预期不一致，又得改程序重新来一边，这会有一点痛苦！在我们本地的HADOOP上运行MR程序非常快，就那么几秒，更加重要的是，我们可以再本地准备输入文件去测试MR的逻辑，这对调试/开发程序非常方便！实例及原理分析假设，我们有这样的输入文件： cate-aspu-11 cate-aspu-12 cate-aspu-23 cate-aspu-24 cate-aspu-35 cate-aspu-36 cate-aspu-17 cate-aspu-48 cate-aspu-49 cat...

2017-11-06

699

1.创建一个用户mandriva,其ID号为2002，基本组为distro(组ID为3003)，附加组为linux 1 2 3 4 5 6 [root@localhost~] #groupadd-g3003distro [root@localhost~] #tail-1/etc/group distro:x:3003: [root@localhost~] #groupaddlinux [root@localhost~] #tail-1/etc/group linux:x:3004: 1 2 3 [root@localhost~] #useradd-u2002-gdistro-Glinuxmandriva [root@localhost~] #idmandriva uid=2002(mandriva)gid=3003(distro) groups =3003(distro),3004(linux)context=root:system_r:unconfined_t:SystemLow-SystemHigh 2.创建一个用户fedora,其全名为Fedora Community,默认she...

2017-11-06

876

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。