博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spark查看stage和tasks信息
阅读量:6348 次
发布时间:2019-06-22

本文共 1368 字,大约阅读时间需要 4 分钟。

  spark提供了web-ui接口、外部命令等多种方法监视spark程序的执行状态。利用spark的监视功能,可以方便的查看spark应用程序执行的状态,具体包括:1)stage和tasks列表信息  2)RDD大小和内存使用情况  3)环境信息  4)executors信息。

  1.web-ui 接口

          可以在浏览器上输入http://<driver-node>:4040,查看spark程序的执行状态。不过spark程序一旦运行完成,web-ui便无法再查看spark状态。

   driver-node信息在spark-submit执行spark任务的过程中会被打印,例如:执行spark-submit --master spark://taoli5:7077 sample.py 提交任务至cluster。日志输出如下,红框中就包含driver-node的信息。

 

2.事后监控

    如果希望在程序结束之后也能访问spark执行状态,可以在启动spark程序之前,设置spark.eventLog.enabled=true,该配置会将展示在web-ui中的展示信息持久化至日志中。之后通过spark history server重建web-ui。具体过程如下:

 1)修改$SPARK_HOME/conf/ spark-defaults.conf

  # spark.master                     spark://master:7077

   spark.eventLog.enabled           true
   spark.eventLog.dir               /home/taoli5/work/project/pyspark/eventLog
   spark.history.fs.logDirectory    /home/taoli5/work/project/pyspark/eventLog
  # spark.serializer                 org.apache.spark.serializer.KryoSerializer
  # spark.driver.memory              5g
  # spark.executor.extraJavaOptions  -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"
  2 )  运行./sbin/start-history-server.sh,启动spark history-server

        该命令会启动一个守护进程(spark history server)作为web-ui服务进程。在执行spark程序之后,你可以在浏览器上输入http://<server-url>:18080,查看spark程序的状态,即使spark程序执行结束,依然可以查看spark程序状态。server-url可以通过查看  start-history-server.sh的启动日志得到。

 

 3)运行spark程序:spark-submit --master spark://taoli5:7077 sample.py

 4) 查看spark执行状态:

 

        点击,进一步查看任务的stage等信息

  

 

 

转载于:https://www.cnblogs.com/litaozijin/p/8903069.html

你可能感兴趣的文章
View和Activity的生命周期
查看>>
解决PHP下载大文件失败,并限制下载速度
查看>>
java B2B2C Springcloud电子商城系统—Feign实例
查看>>
java B2B2C Springcloud多租户电子商城系统 (五)springboot整合 beatlsql
查看>>
Throwable是一个怎样的类?
查看>>
Python基础(一)
查看>>
三条代码 搞定 python 生成验证码
查看>>
我的友情链接
查看>>
我的友情链接
查看>>
无线和有线路由哪种性能更好
查看>>
Dwr3.0纯注解(纯Java Code配置)配置与应用浅析三之后端反向调用前端
查看>>
Ubuntu下安装遨游浏览器
查看>>
自定义Linux service脚本
查看>>
微信开发之发红包
查看>>
一键lnmp脚本&&php扩展模块安装(适用于CENTOS6.X系列)
查看>>
二维观察---文字的裁剪
查看>>
矩形覆盖
查看>>
ICMP
查看>>
界面设计模式(第2版)(全彩)
查看>>
解决VMware Workstation错误:未能锁定文件
查看>>