通过eclipse调试MapReduce任务
利用MapReduce利器作开发,不论从思想上还是技能上都是新的体验。以下罗列下如何利用eclipse调试MR任务。(本人环境:hadoop 1.0.2,部署在linux上,本地windows开发)1、安装hadoop。先在linux上安装好hadoop,为更接近线上环进,我的是安装成Cluster注意要远程访问相关端口,conf/mapred-site.xml中localhost:9001中需要换成ip加端口。sh bin/start-all.sh启动,先按文档命令行跑一下example的wordcount。我安装好运行example遇到了XML解析的错(原因应该是${java.home}/lib/jaxp.properties没有设置,见:javax.xml.xpath.XPathFactory.newInstance(uri)的注释),后来手动加了xalan-j_2.7.0.jar、xercesImpl-2.7.1.jar、xml-apis-2.7.1.jar、xmlenc-0.52.jar、serializer-2.7.1.jar几个包解决。2、下载hadoop eclipse...