博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark的日志配置
阅读量:7140 次
发布时间:2019-06-28

本文共 2176 字,大约阅读时间需要 7 分钟。

hot3.png

在测试spark计算时,将作业提交到yarn(模式–master yarn-cluster)上,想查看print到控制台这是imposible的,因为作业是提交到yarn的集群上,so 去yarn集群上看日志是很麻烦的,但有特别想看下print的信息,方便调试或者别的目的

在Spark的conf目录下,把log4j.properties.template修改为log4j.properties,原来的内容如下:

#Set everything to be logged to the console log4j.rootCategory=INFO, console log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log4j.PatternLayout log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n

#Settings to quiet third party logs that are too verbose log4j.logger.org.spark-project.jetty=WARN log4j.logger.org.spark-project.jetty.util.component.AbstractLifeCycle=ERROR log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFO log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO

把log4j.rootCategory=INFO, console改为log4j.rootCategory=WARN, console即可抑制Spark把INFO级别的日志打到控制台上。如果要显示全面的信息,则把INFO改为DEBUG。

如果希望一方面把代码中的println打印到控制台,另一方面又保留spark 本身输出的日志,可以将它输出到日志文件中

log4j.rootCategory=INFO, console,FILE log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log4j.PatternLayout log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n

Settings to quiet third party logs that are too verbose

log4j.logger.org.eclipse.jetty=WARN log4j.logger.org.eclipse.jetty.util.component.AbstractLifeCycle=ERROR log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFO log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO

log4j.appender.FILE=org.apache.log4j.DailyRollingFileAppender log4j.appender.FILE.Threshold=DEBUG log4j.appender.FILE.file=/home/hadoop/spark.log log4j.appender.FILE.DatePattern='.'yyyy-MM-dd log4j.appender.FILE.layout=org.apache.log4j.PatternLayout log4j.appender.FILE.layout.ConversionPattern=[%-5p] [%d{yyyy-MM-dd HH:mm:ss}] [%C{1}:%M:%L] %m%n

spark

log4j.logger.org.apache.spark=INFO

上面的操作,spark的日志一方面打印到控制台,一方面写入到/home/hadoop/spark.log中了,这是日志的继承特性,后面再来改进,目前把log4j.rootCategory=INFO, console,FILE改为log4j.rootCategory=INFO, FILE即可

转载于:https://my.oschina.net/ghostmanyue/blog/487190

你可能感兴趣的文章
Grafana 6.0正式发布!新增查询工作流,全新独立Gauge面板
查看>>
handle中存在异步操作,window.open被浏览器阻止的问题
查看>>
Git 2.18版本已支持Git协议v2
查看>>
网易戏精ARCore短视频新玩法实践
查看>>
Swift采用语言服务器协议
查看>>
OpenAI发布大型强化深度学习模拟器Neural MMO,AI适者生存择最优
查看>>
移动应用开发过程中的迭代式原型设计
查看>>
Mozilla “Common Voice” 开源语音识别项目
查看>>
Swift 5进入发布倒计时
查看>>
MacOS入门
查看>>
[LintCode] Palindrome Linked List
查看>>
vue初探--编写表格组件
查看>>
C# 版本微信 JS SDK 示例代码
查看>>
oracle 升级12c参数样例
查看>>
EventID:13 Source:NPS -------Radius
查看>>
kubernetes代码阅读-apiserver之list-watch篇
查看>>
视频点播开发者实战:视频水印动态替换
查看>>
Kubernetes日志采集与分析的最佳实践 资料下载 ...
查看>>
SpringMVC+Json构建基于Restful风格的应用
查看>>
Fescar - RM InsertExecutor介绍
查看>>