`
kavy
  • 浏览: 891114 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Mesos的分析1 --- 原理、安装、部署过程

 
阅读更多

Berkeley推出之后,即可引起了学术界的深入研究。目前,代码已经在github上可以下载。

它的框架图如下:
Mesos的分析1 <wbr>--- <wbr>原理、安装、部署过程
从这个框架中,重点在于集群资源的复用,和作业的管理。
Mesos的创新在于:如何支持不同的分布式计算框架,而解决这个问题的关键是,如何将Mesos管理的资源分配给Hadoop。为了介绍清楚,下面将Mesos的调度模块的将架构贴上:
Mesos的分析1 <wbr>--- <wbr>原理、安装、部署过程

上图的Framework表示的是一种分布式计算框架,例如Hadoop。通过JobClient提交了作业之后,交由JobTracker通过心跳与TaskTracker进行任务分配,在JobTracker中会由TaskScheduler分配task到具体的TaskTracker是执行,在选择哪个TaskTracker去执行的过程中,Mesos不参与,完全由Hadoop自己的Master-Slave的框架来作,只是在申请资源的过程中,会通过其中Mesos提供的分配资源的模块进行资源的请求,Mesos资源分配模块,会根据当前分布式系统中资源的使用情况,适时地将作业下放到对应TaskTracker所在节点。

在编译Mesos的过程中,出现了以下的问题:
找不到对应gtest.h的问题,需要重新到google code上把该包下载下来即可。安装之后,在按照Mesos文档的要求实现安装。
我在安装的过程中出现了两个问题:
1)gtest.h的文件不存在。Mesos的configure没有将gtest的编译放进管理的区域内,因此找不到。
解决措施:直接从google code上下载gtest,然后首先自行安装,然后再次编译。
2)jni,由于mesos将其资源分配模块通过SWIG提供java接口。编译报错:jni_md.h 文件找不到。
解决措施:将$JAVA_HOME/include/linux/* 下的文件拷贝到 $MESOS_HOME/include 即可。

注意,如果机器是32位的话,还要加上--march=i484的参数,下面附上我使用的参数:

./configure --with-python-headers=/usr/include/python2.6 --with-webui --with-java-home=/opt/sun-jdk-1.6.0.17/  --with-java-headers=/opt/sun-jdk-1.6.0.17/include/ --with-included-zookeeper CXXFLAGS="-march=i486"

然后 make
在启动Master Slave Daemon
启动Master:
bin/mesos-master


I0411 15:13:16.455807 31275 logging.cpp:40] Logging to /home/jiangbing/mesos/logs
I0411 15:13:16.456114 31275 main.cpp:60] Creating event logger.
I0411 15:13:16.456135 31275 event_logger.cpp:75] No log directory was specified, so not creating any event writers (e.g. FileEventWriter). No event logging will happen!
I0411 15:13:16.456178 31275 main.cpp:71] Build: 2011-04-11 14:32:07 by root
I0411 15:13:16.456197 31275 main.cpp:72] Starting Mesos master
I0411 15:13:16.456627 31276 master.cpp:266] Master started at mesos://1@10.5.0.55:5050
I0411 15:13:16.456670 31275 webui.cpp:63] Starting master web UI on port 8080
I0411 15:13:16.456715 31278 webui.cpp:31] Web UI thread started
I0411 15:13:16.456728 31276 master.cpp:276] Master ID: 201104111513-0
I0411 15:13:16.456748 31276 master.cpp:1115] Creating "simple" allocator
I0411 15:13:16.456799 31276 master.cpp:294] New master detected ... maybe it's us!
I0411 15:13:16.469812 31278 webui.cpp:43] Loading webui/master/webui.py
Bottle server starting up (using WSGIRefServer())...
Listening on http://0.0.0.0:8080/
Use Ctrl-C to quit.

启动Slave
bin/mesos-slave  --url=mesos://1@10.5.0.55:5050


I0411 15:14:26.927850 31291 logging.cpp:40] Logging to /home/jiangbing/mesos/logs
I0411 15:14:26.928165 31291 main.cpp:66] Creating "process" isolation module
I0411 15:14:26.928184 31291 main.cpp:74] Build: 2011-04-11 14:32:19 by root
I0411 15:14:26.928200 31291 main.cpp:75] Starting Mesos slave
I0411 15:14:26.928655 31292 slave.cpp:149] Slave started at 1@10.5.0.55:40244
I0411 15:14:26.928681 31291 webui.cpp:74] Starting slave web UI on port 8081
I0411 15:14:26.928736 31294 webui.cpp:34] Web UI thread started
I0411 15:14:26.928771 31292 slave.cpp:160] setting up webUIUrl on port 8081
I0411 15:14:26.928829 31292 slave.cpp:181] New master at 1@10.5.0.55:5050 with ID:0
I0411 15:14:26.929329 31292 slave.cpp:217] Registered with master; given slave ID 201104111513-0-0
I0411 15:14:26.941684 31294 webui.cpp:47] Loading webui/slave/webui.py
Bottle server starting up (using WSGIRefServer())...
Listening on http://0.0.0.0:8081/
Use Ctrl-C to quit.

 

http://blog.sina.com.cn/s/blog_4a1f59bf0100qmmq.html

分享到:
评论

相关推荐

    Mesos.in.Action.2016.5.pdf

    这一章节介绍了如何利用Aurora来简化应用部署流程和任务调度过程,并探讨了其与Marathon、Chronos之间的区别和联系。 **第10章:未列出** 该章节可能是对前面章节内容的总结或深入探讨,但具体细节未能从提供的...

    Spark部署中的关键问题解决之道--许鹏.zip

    1. YARN与Mesos:Spark可以运行在Hadoop的YARN或Mesos之上,理解这两种资源管理框架的工作原理至关重要。YARN提供细粒度的资源调度,而Mesos则更强调通用性和跨框架支持。 2. 资源分配:合理设置executor数量、内存...

    dr-elephant-master-spark2.0.zip

    Dr Elephant通过对YARN或Mesos等集群管理器的日志进行分析,提供关于Spark作业的执行时间、资源利用率等关键指标的可视化报告,帮助用户识别性能瓶颈,进而优化Spark应用程序。它通过解析Spark的事件日志,提供了...

    spark基础,关于spark的安装和几种模式的部署

    Spark是大数据处理领域的一款高效、通用且可扩展的开源计算框架,它...总之,Spark的安装和部署是一个综合性的过程,涉及到多个组件的配置和协调。理解和掌握这些知识点对于有效地使用Spark进行大数据处理至关重要。

    Spark大数据内核天机解密- to 丁立清.pdf

    分析源码理解如何实现数据的排序和写入过程,包括如何优化排序算法、减少磁盘I/O等。 ##### 4. TungstenSortedBasedShuffle **4.1 概述** TungstenSortedBasedShuffle是在Tungsten项目基础上实现的优化版...

    spark基础知识.zip

    - 安装与配置:如何在不同环境上部署Spark。 - Shell操作:通过Spark Shell进行交互式数据分析。 - DataFrame/Dataset API:作为更高级的数据抽象,替代了RDD,提供更丰富的类型安全和优化。 3. **Spark编程实例...

    spark原理与调优详解

    Standalone 模式是 Spark 的默认模式,YARN 模式则是将 Spark 部署在 Hadoop 集群中,Mesos 模式则是将 Spark 部署在 Mesos 集群中。 Spark 开发 Spark 的开发包括 Spark-shell 和提交模式两种。Spark-shell 是一...

    Spark原理及源码剖析1

    本文将深入探讨Spark的原理及源码分析,首先从Spark运行时的通用流程入手,然后介绍核心组件的角色与职责,以及Spark支持的不同集群部署模式。 在Spark的运行流程中,用户通过`spark-submit`提交应用程序。这个过程...

    通过案例实战掌握高可用HA下的Spark集群部署

    根据提供的信息,我们可以深入探讨如何通过案例实战来掌握高可用(High Availability,简称HA)环境下的Apache Spark集群部署。此部分将重点介绍高可用性在Spark集群中的意义、实现方式以及实战过程中的关键步骤。 ...

    elastic-job可以案例

    而Elastic-Job-Cloud则结合了Mesos框架,适用于大规模集群环境。 二、核心特性 1. **弹性扩展**:Elastic-Job能够根据集群规模动态调整任务执行节点,实现任务的水平扩展。 2. **故障转移**:如果某个节点在执行...

    【hadoop&spark】资源

    - **部署方式**:Spark既可以独立部署,也可以部署在Hadoop的YARN之上。 - **集成优势**:利用Hadoop的YARN进行资源管理,使Spark能够在Hadoop集群上高效运行。 #### 三、Spark相对于Hadoop的优势 - **运行速度**...

    大数据spark企业级实战 完整版

    8. **集群部署与运维**:了解如何在YARN、Mesos或独立模式下部署Spark集群,以及监控和故障排查技巧。 9. **案例研究**:通过真实的企业级案例,了解Spark如何解决实际业务问题,如日志分析、推荐系统、广告点击率...

    大数据Spark面试题汇总

    1. **Spark的部署模式**: - **Standalone**:Spark自身提供的集群管理器,简单易用,适合小规模或内部测试环境。 - **Hadoop YARN**:在YARN上运行,利用Hadoop的资源调度,适合已经部署了Hadoop的环境。 - **...

    tachyon-0.6.4-bin.tar.gz

    Tachyon部署通常与Hadoop YARN或Mesos集群结合,利用集群的空闲内存资源。配置包括设置内存大小、数据复制策略、心跳间隔等参数,以适应不同的应用场景。 4. **使用案例** - 在实时数据分析场景中,Tachyon可以...

    Spark分布式集群安装包

    在安装过程中,首先你需要解压下载的Spark-2.2.0-bin-hadoop2.7压缩包,然后根据官方文档或者网络上的教程配置Spark的环境变量,如SPARK_HOME、PATH等。接着,你需要配置Spark与你的Hadoop集群的连接,包括设置...

    SDCC2016技术总结

    - **主流容器**:如Docker、Mesos、Kubernetes等,它们为自动化部署、管理和扩展应用程序提供了强大的支持。 - **DevOps**:一种文化和实践方法论,强调软件开发人员和运维人员之间的紧密合作,以加快软件交付的速度...

    Spark技术内幕 深入解析Spark内核架构设计与实现原理 高清 完整书签

    9. **Spark实战**:提供实际案例,展示如何在不同场景下部署和运行Spark应用,包括数据预处理、实时分析、推荐系统等。 通过这本书,读者不仅可以掌握Spark的基础知识,还能深入了解其内核机制,从而更好地利用...

    Spark Introduction

    - **Mesos**:Apache Mesos是一个分布式资源管理系统,Spark可以集成到Mesos之上,从而与其他应用共享集群资源。 - **YARN**:Hadoop YARN是另一种常见的集群资源管理系统,Spark也可以在YARN之上运行,这为大规模...

    史上最全最详细的flink 中文教程(一千多页pdf).pdf

    Apache Flink 是一款开源流处理框架,用于处理和分析数据流。它具有高度的伸缩性、高性能和事件...通过阅读这些文档,开发者可以更加深入地理解 Flink 的架构和原理,更好地掌握使用 Flink 进行数据处理和分析的技巧。

    spark项目代码以及数据

    Spark可以运行在本地模式、集群模式(如YARN、Mesos或独立部署)以及云环境。选择合适的部署模式取决于项目需求,如资源可用性、扩展性和运维复杂性。 七、性能优化 Spark项目中通常需要关注性能优化,包括: - ...

Global site tag (gtag.js) - Google Analytics