Spark源码的编译过程详细解读(各版本)(博主推荐)
重新试多几次。编译过程中会出现下载某个包的时间太久,这是由于连接网站的过程中会出现假死,按ctrl+c,重新运行编译命令。 如果出现缺少了某个文件的情况,则要先清理maven(使用命令mvnclean)再重新编译。 Spark源码编译的3大方式 1、Maven编译 2、SBT编译 (暂时没) 3、打包编译make-distribution.sh 前言 Spark可以通过SBT和Maven两种方式进行编译,再通过make-distribution.sh脚本生成部署包。 SBT编译需要安装git工具,而Maven安装则需要maven工具,两种方式均需要在联网 下进行。 尽管maven是Spark官网推荐的编译方式,但是sbt的编译速度更胜一筹。因此,对于spark的开发者来说,sbt编译可能是更好的选择。由于sbt编译也是基于maven的POM文件,因此sbt的编译参数与maven的编译参数是一致的。 心得 有时间,自己一定要动手编译源码,想要成为高手和大数据领域大牛,前面的苦,是必定要吃的。 无论是编译spark源码,还是hadoop源码。新手初次编...
