本博客属原创文章,转载请注明出处: http://guoyunsky.iteye.com/blog/1243417
欢迎加入Hadoop超级群: 180941958
cloudera里面有基于Oozie的安装,但是通过sudo apt-get install oozie的方式.其中你要将cloudera hadoop的source放入sources.list.由于我升级了最新的Ubuntu.但对应的cloudera hadoop还没有相应的版本.所以添加sources.list无法成功.网上也没什么手动安装的资料,于是我就写点吧.参考来源: http://incubator.apache.org/oozie/quick-start.html#AG_Install
Oozie依赖hadoop,tomcat,ext(可选,如果需要查看web控制界面就需要安装).我这里Hadoop版本是0.20.2,tomcat版本是tomcat6,ext是ext-2.2.同时我这里安装的Oozie版本是3.0.2
1)先下载Oozie,下载地址:https://github.com/yahoo/oozie/downloads .我的下载路径是/home/guoyun/Downloads/oozie-3.0.2-distro.tar.gz
2)下载ext-2.2.zip,下载网址: http://code.google.com/p/eas/downloads/detail?name=Ext-2.2.zip&can=2&q= .我的下载路径是/home/guoyun/Downloads/ext-2.2.zip
3)安装tomcat,但Oozie依赖于通过$CATALINA_HOME/bin/startup.sh的方式启动Tomcat,所以通过Ubuntu自带的方式安装Tomcat貌似行不通(也就是sudo apt-get install tomcat6).于是还是手动上tomcat官网下载tomcat6.我的下载路径是/home/guoyun/Downloads/apache-tomcat-6.0.33.tar.gz
4)设置环境变量
vi ~/.bashrc
将OOZIE_HOME,CATALINA_HOME设置好,比如我这里是
export OOZIE_HOME=/home/guoyun/Downloads/oozie-3.0.2
export CATALINA_HOME=/home/guoyun/Downloads/apache-tomcat-6.0.33
设置好后运行命令:source ~/.bashrc.
这里可以验证设置是否成功,输入命令:$CATALINA_HOME/bin/startup.sh,然后浏览器里输入http://localhost:8080,如果浏览器里可以看到tomcat,则表示设置成功.下一步安装OOZIE
5)安装OOZIE
输入命令:$OOZIE_HOME/bin/oozie-setup.sh -hadoop 0.20.2 ${HADOOP_HOME} -extjs /home/guoyun/Downloads/ext-2.2.zip
其中0.20.2是你机器hadoop的版本
${HADOOP_HOME}是你机器上Hadoop的安装目录,我这里也是放到环境变量里.
/home/guoyun/Downloads/ext-2.2.zip就是刚下载的ext-2.2.zip所在路径.
运行这条命令Oozie会将hadoop相关jar和oozie等拷贝到Oozie中.同时得到以下结果则代表你安装成功:
New Oozie WAR file with added 'Hadoop JARs, ExtJS library' at /home/guoyun/hadoop/oozie-3.0.2/oozie- server/webapps/oozie.war
INFO: Oozie is ready to be started
如果报 Specified Oozie WAR '/xxx/oozie.war' already contains Hadoop JAR files 这种错误则表示你到oozie.war中已经包含了hadoop-xxx.jar.如此会导致extjs也安装不进去。解决到方法是到你对应到/xxx/oozie.war中删除掉hadoop-xxx.jar再重新安装即可.
6)启动OOZIE
这里你要先确定你的Tomcat没有在运行.输入命令:
$OOZIE_HOME/bin/oozie-run.sh
之后会看到一大把的输出,同时Oozie会启动Tomcat.当你看到
2011-11-8 15:41:21 org.apache.catalina.startup.Catalina start
信息: Server startup in 7365 ms
则表示Oozie启动成功.
7)查看web控制台
输入命令:
$OOZIE_HOME/bin/oozie admin -oozie http://localhost:11000/oozie -status
更多技术文章、感悟、分享、勾搭,请用微信扫描:
相关推荐
Hadoop集群安装笔记是一篇详细的安装指南,旨在帮助新手快速搭建Hadoop学习环境。以下是该笔记中的重要知识点: Hadoop集群安装目录 在安装Hadoop集群之前,需要准备好安装环境。安装环境包括Java Development Kit...
Hadoop学习笔记,自己总结的一些Hadoop学习笔记,比较简单。
本笔记将从环境搭建、HDFS配置、YARN配置、分布式配置到MapReduce编程,全方位介绍Hadoop的学习过程,并结合JavaWeb项目实践,帮助读者深入理解Hadoop的工作原理和应用。 ### 一、环境搭建 在开始Hadoop的学习之前...
Hadoop 学习笔记.md
【HADOOP学习笔记】 Hadoop是Apache基金会开发的一个开源分布式计算框架,是云计算领域的重要组成部分,尤其在大数据处理方面有着广泛的应用。本学习笔记将深入探讨Hadoop的核心组件、架构以及如何搭建云计算平台。...
云计算,hadoop,学习笔记, dd
Hadoop是一种开源的分布式存储和计算系统,它由Apache软件基金会开发。在初学者的角度,理解Hadoop的组成部分以及其架构设计是学习Hadoop的基础。 首先,Hadoop的分布式文件系统(HDFS)是其核心组件之一,它具有高...
本文将根据提供的Hadoop学习笔记,深入解析Hadoop的关键概念和实战技巧,帮助读者构建扎实的Hadoop知识体系。 一、Hadoop简介 Hadoop的核心思想源于Google的两篇论文——“GFS”(Google File System)和...
Hadoop安装通常包括下载、配置和启动集群的NameNode和DataNode。NameNode是HDFS的主节点,负责管理文件系统的命名空间和客户端对文件的访问。DataNode是从节点,负责存储实际的数据块。Hadoop集群启动时,NameNode...
2. **分布式计算**:MapReduce是一种编程模型,用于在Hadoop集群上并行处理和生成大型数据集。 3. **可扩展性**:Hadoop可以处理从GB到PB级别的数据,可以在集群中增加更多的节点来扩展存储和计算能力。 4. **可靠...
在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理Hadoop作业。它允许用户定义、调度和协调各种Hadoop相关任务,如MapReduce、Pig、Hive、Sqoop等。当遇到“Table ‘oozie.VALIDATE_CONN’ doesn’t exist”...
在大数据领域,构建一个完整的生态系统是至关重要的,其中包括多个组件,如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作,提供了数据存储、处理、调度、流...
Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...
Hadoop 云计算 2.0 ...Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍为我们提供了 Hadoop 的生态系统特点、Hadoop 生态系统概况、HDFS 和 MapReduce 的架构和原理等方面的知识点,对于学习 Hadoop 和云计算非常有帮助。
2. **Hadoop环境**:已安装好Hadoop环境,并且能够正常启动Hadoop服务。 3. **JDK环境**:确保计算机上已正确安装JDK,并且环境变量配置完成。 #### 三、解压Hadoop安装包 1. **解压位置**:将下载好的Hadoop...