spark on yarn 配置及异常解决
版权声明:本文由董可伦首发于https://dongkelun.com,非商业转载请注明作者及原创出处。商业转载请联系作者本人。 https://blog.csdn.net/dkl12/article/details/80256461 我的原创地址:https://dongkelun.com/2018/04/16/sparkOnYarnConf/ 前言 YARN 是在Hadoop 2.0 中引入的集群管理器,它可以让多种数据处理框架运行在一个共享的资源池上,并且通常安装在与Hadoop 文件系统(简称HDFS)相同的物理节点上。在这样配置的YARN 集群上运行Spark 是很有意义的,它可以让Spark 在存储数据的物理节点上运行,以快速访问HDFS 中的数据。 1、配置 1.1 配置HADOOP_CONF_DIR vim /etc/profile export HADOOP_CONF_DIR=/opt/hadoop-2.7.5/etc/hadoop source /etc/profile 1.2 命令行启动 spark-shell --master yarn 但是在spark2.x里...