Spark中的监控----日志聚合的配置，以及REST Api - zzm - ITeye博客

`

m635674608

浏览: 5086333 次
性别:
来自: 南京

最近访客更多访客>>

wusuosuo

yijiaomuqing

millerchu

xdung

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

明兜3号：部署落地+业务迁移玩转k8s进阶与企业级实践技能（又名：Ku ...
Kubernetes系统常见运维技巧
q328965539：牛掰啊资料收集的很全面
HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝（TFS）
guichou： fluent挂载了/var/lib/kubelet/pods目 ...
kubernetes上部署Fluentd+Elasticsearch+kibana日志收集系统
xu982604405： System.setProperty("java.r ...
jmx rmi 穿越防火墙问题及jmxmp的替代方案
大漠小帆：麻烦问下，“获取每个Item相似性最高的前N个Item”，这个 ...
协同过滤推荐算法在MapReduce与Spark上实现对比

Spark中的监控----日志聚合的配置，以及REST Api

博客分类：

spark

阅读更多

一：History日志聚合的配置

1.介绍

　　Spark的日志聚合功能不是standalone模式独享的，是所有运行模式下都会存在的情况

　　默认情况下历史日志是保存到tmp文件夹中的

　　

2.参考官网的知识点位置

　　

3.修改spark-defaults.conf

　　

4.修改env.sh

　　

5.在HDFS上新建/spark-history

　　bin/hdfs dfs -mkdir /spark-history

6.启动历史服务

　　sbin/start-history-server.sh

　　

7.测试　　

　　webUI: http://192.168.187.146:18080/
　　local模式：bin/spark-shell
　　standalone模式：bin/spark-shell --master spark://linux-hadoop3.ibeifeng.com:7070

8.local模式的测试

　　bin/spark-shell

　　然后输入程序。

　　在

　　

9.standalone模式

　　bin/spark-shell --master spark://linux-hadoop3.ibeifeng.com:7070

　　输入程序

　　

二：RestApi

　　返回应用程序的执行结果。

1.关于RestApi的官网

　　也是属于monitor的部分

　　

2.介绍

　　专门用于获取历史应用的执行结果

　　用法： http://<server-url>:18080/api/v1

3.使用

　　http://linux-hadoop3.ibeifeng.com:18080/api/v1/applications

　　

4.进一步使用

　　http://linux-hadoop3.ibeifeng.com:18080/api/v1/applications/app-20170206042834-0000/jobs

　　

http://www.cnblogs.com/juncaoit/p/6379006.html

分享到：

Selenium WebDriver 中鼠标事件 | 常用hadoop Spark监控Tab

2017-05-27 18:27
浏览 1345
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

kafka-connector的使用.zip_kafka: 在本例中，描述提到的是一个专用于收集日志的 Kafka 插件，这可能是为了实现日志聚合、分析或者实时监控。 **二、Kafka Connector 的架构** Kafka Connect 由两部分组成：Connector 和 Worker。Connector 负责定义...

ELK-guide-cn.pdf: ELK stack是一套流行的开源日志分析解决方案，其名称由 Elasticsearch、Logstash 和 Kibana 三个软件的...通过本指南，你可以了解到ELK stack在海量日志分析中的作用，以及如何搭建和使用这一强大的日志处理解决方案。

阿里云Elasticsearch7.x jar包.zip: - `log4j-api-2.7.jar`：日志框架Log4j的API部分，Elasticsearch使用Log4j记录和管理日志信息。 - `jackson-dataformat-cbor-2.8.11.jar`：Jackson库的一个模块，用于处理CBOR（ Concise Binary Object ...

CDH-HDP-MAPR-DKH-星环组件比较.pdf: 9. **Flume**：Cloudera开发的数据收集系统，可高效、可靠地收集、聚合和移动大量日志数据。 10. **Oozie**：工作流管理系统，用于调度和监控Hadoop作业，确保集群作业的顺利执行。 11. **Solr**：基于Lucene的...

CDHHDPMAPRDKH星环组件比较.docx: 【Apache Knox】是一个安全网关，提供REST API的统一访问入口。【Apache Ranger】是权限管理框架，用于管理Hadoop生态系统的复杂数据权限。【Slider】是YARN应用，用于在YARN上部署和管理现有的分布式应用。 ...

Apache-Kafka-Documentation:Apache Kafka中文文档: Kafka提供了Java和Scala的生产者和消费者API，以及基于HTTP的REST Proxy接口，方便不同语言的应用接入。 **五、部署与配置** Kafka集群的部署涉及到broker配置、Zookeeper配置、安全性设置等，需要根据实际需求...

dataimport_scala_数据入库_: Elasticsearch是一种分布式、RESTful搜索和分析引擎，用于实时全文检索、日志聚合和分析。结合Kafka，我们可以实现数据的实时流转，确保数据的快速索引和查询。实现这一过程通常分为以下步骤： 1. **设置环境**：...

crmaggregator: 在IT领域，数据聚合是常见的需求，特别是在大数据分析、实时监控和日志管理等场景中。"赫鲁库"可能是项目作者或开发者的名字，也可能是一个特定的术语或组件，但由于信息有限，无法进一步明确其具体含义。...

Covid19_Distributed_Systems_WebService: 6. **监控与日志**：为了保证系统的稳定运行，可能会使用Prometheus和Grafana进行性能监控，ELK Stack（Elasticsearch, Logstash, Kibana）或Logback进行日志收集和分析。 7. **持续集成/持续部署（CI/CD）**：...

bigdata_blogs:与大数据博客相关的项目（例如elasticsearch）: 它被广泛应用于日志分析、监控系统、信息检索、商业智能等领域。Elasticsearch的核心功能包括全文搜索、结构化搜索、聚合分析以及实时数据分析。 3. **JavaScript**：JavaScript是一种轻量级的解释型编程语言，主要...

Global site tag (gtag.js) - Google Analytics