Ubuntu16.04安装Hadoop2.6+Spark1.6+开发实例
Ubuntu16.04安装Hadoop2.6+Spark1.6,并安装python开发工具Jupyter notebook,通过pyspark测试一个实例,調通整个Spark+hadoop伪分布式开发环境。 主要内容:配置root用户,配置Hadoop,Spark环境变量,Hadoop伪分布式安装并测试实例,spark安装并通过Jupter notebook进行开发实例,配置Jupter notebook兼容Python2和python3双内核共存开发。 默认已经正确安装了JDK,并设置了JAVA_HOME(安装JDK教程较多,不再赘述) 1.配置环境变量 1.0 配置SSH ssh免密匙登录 sudo apt-get install ssh sudo apt-get install rsync ssh-keygen -t rsa //一路回车就好 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ssh localhost //不需要输入密码时即成功 1.1.进入root用户 1.1.1 root用户初始为禁止登陆,通过重新设...