Spark 通过 spark-submit 设置日志级别
我的原创地址:https://dongkelun.com/2018/11/15/sparkSubmitLogLevel/
前言
Spark有多种方式设置日志级别,这次主要记录一下如何在spark-submit设置Spark的日志级别。
1、需求
因为Spark的日志级别默认为INFO(log4j.rootCategory=INFO, console),这样在运行程序的时候有很多我不需要的日志信息都打印出来了,看起来比较乱,比较烦,抓不住重点,而我只想把warn和error打印出来。
之前在测试环境或者在eclipse我是通过其他几种方式(下面会介绍)设置的,但是在生产环境下不允许我修改集群的配置文件(不是我负责~),而在代码里设置日志级别却不生效(原因还没找到),最后通过spark-submit里设置日志级别搞定的。
2、spark-submit 设置
spark-submit --conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=file:log4j.properties"
其中log4j.properties为我将本地的日志文件,拷贝到执行spark-submit的机器上
参考:https://blog.csdn.net/xueba207/article/details/50436684
3、其他几种设置方法
3.1 修改集群的配置文件
cd $SPARK_HOME/conf cp log4j.properties.template log4j.properties vim log4j.properties
将log4j.rootCategory=INFO, console改为log4j.rootCategory=WARN, console
3.2 在Eclipse里设置
将log4j.properties放在项目的src/main/resources即可
- Spark 默认日志文件:org/apache/spark/log4j-defaults.properties
3.3 代码里配置(未生效)
spark.sparkContext.setLogLevel("WARN")
- 在代码里设置,不生效原因未知
4、 总结
- 1、如果在自己的测试集群上,直接修改$SPARK_HOME/conf下的log4j.properties即可
- 2、如果在Eclipse里,将log4j.properties放在项目的src/main/resources即可
- 3、如果在生产环境的集群,又不允许修改配置文件的话,用上面讲的spark-submit --conf 即可

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
HBase实操 | 如何使用HBase存储图片
1.文档编写目的 Fayson在前面的文章中介绍了《如何使用HBase存储文本文件》和《如何使用Lily HBase Indexer对HBase中的数据在Solr中建立索引》,实现了文本文件保存到HBase中,并基于Solr实现了文本文件的全文检索。如果我们碰到的是图片文件呢,该如何保存或存储呢。本文主要描述如何将图片文件转成sequence file,然后保存到HBase。 内容概述 1.文件处理流程 2.准备上传文件的Java代码 3.运行代码 4.Hue中查询验证 测试环境 1.RedHat7.4 2.CM5.14.3 3.CDH5.14.2 4.集群未启用Kerberos 2.图片处理流程 1.如上图所示,Fayson先在本地准备了一堆图片文件,并上传到HDFS。 上传到HDFS 2.然后通过Java程序遍历所有图片生成一个Sequence File,
- 下一篇
HBase实操 | 如何使用HBase存储文本文件
1.文档编写目的 Fayson在前面的文章中介绍了《如何在CDH中使用Solr对HDFS中的JSON数据建立全文索引》和《如何使用Flume准实时建立Solr的全文索引》,假如我们有大量的文本文件,我们应该如何保存到Hadoop中,并实现文本文件的全文检索呢。为了介绍如何对文本文件进行全文检索,本文会先介绍如何使用HBase保存文本文件。虽然HDFS中也可以直接保存这种非结构化数据,但是我们知道像这种文本文件,一般都是10KB~1MB的小文件,因为HDFS并不擅长存储大量小文件,所以这里选择HBase来保存。 内容概述 1.文件处理流程 2.准备上传文件的Java代码 3.运行代码 4.Hue中查询验证 测试环境 1.RedHat7.4 2.CM5.14.3 3.CDH5.14.2 4.集群未启用Kerberos 2.文件处理流程 1.如上图所示,Fays
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS关闭SELinux安全模块
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS8编译安装MySQL8.0.19