hadoop(6)2.6.0 and Example
1. Prepare
ProtocolBuffer Installation
> git clone https://github.com/google/protobuf.git
> ./autogen.sh
> ./configure --prefix=/home/carl/tool/protobuf-3.0.0
> make
> make check
> make install
Add that to path.
> protoc --version
libprotoc 3.0.0
Need to switch to 2.5.0 version
JDK Installation
> java -version
java version "1.6.0_45"
java version "1.6.0_45"
Java(TM) SE Runtime Environment (build 1.6.0_
MAVEN Installation
Unzip and place in the right directory, adding to path
> mvn --version
Apache Maven 3.2.5 (12a6b3acb947671f09b81f49094c53f426d8cea1; 2014-12-14T11:29:23-06:00)
Apache Maven 3.2.5 (12a6b3acb947671f09b81f49094c53f426d8cea1; 2014-12-14T11:29:23-06:00)
Maven home: /opt/maven
Add this to stop the out of memory error
export MAVEN_OPTS="-Xmx512m -XX:MaxPermSize=128m"
Hadoop Src Build
> mvn package -Pdist -DskipTests -Dtar
Find the release dist file hadoop-2.6.0.tar.gz
I get “JAVA_HOME not set” Error message, I already have the JAVA_HOME in .profile, but I added it in
/opt/hadoop/etc/hadoop/hadoop-env.sh as well.
export JAVA_HOME="/usr/lib/jvm/java-8-oracle"
Configure the SSH on master
> cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
Format file system
Format the filesystem
>hdfs namenode -format
All the configuration should take reference from
It works. Change the etc/hadoop/slaves files to have a machine list there.
Command line to start the HDFS and YARN
> sbin/start-dfs.sh
> sbin/start-yarn.sh
Tips
Error Message:
autoreconf: not found
Solution:
>sudo apt-get install autoconf
Error Message:
Can't exec "libtoolize": No such file or directory at /usr/share/autoconf/Autom4te/FileUtils.pm line 345, <GEN7> line 6.
autoreconf: failed to run libtoolize: No such file or directory
autoreconf: failed to run libtoolize: No such file or directory
autoreconf: libtoolize is needed because this package uses Libtool
Solution:
> sudo apt-get install libtool
Error Message:
checking how to run the C++ preprocessor... /lib/cpp
configure: error: in `/home/carl/install/protobuf':
configure: error: in `/home/carl/install/protobuf':
configure: error: C++ preprocessor "/lib/cpp" fails sanity check
Solution:
> sudo apt-get install g++
Error Message:
protoc version is 'libprotoc 3.0.0', expected version is '2.5.0'
Solution:
Switch to 2.5.0
References:
http://sillycat.iteye.com/blog/1556106 Hadoop doc and Installation on ubuntu with an old version
http://sillycat.iteye.com/blog/1556107 cluster of the old version
http://sillycat.iteye.com/blog/2084169 yet another resource negotiator 2.4.0
http://sillycat.iteye.com/blog/2090186 cluster 2.4.1
http://sillycat.iteye.com/blog/2090937 eclipse and example
相关推荐
《Hadoop 2.6.0:Apache与CDH版本详解》 Hadoop,作为大数据处理领域的核心组件,是开源社区的重要成果,尤其在2.6.0版本中,其功能更加完善,性能显著提升。这里我们将深入探讨两个重要的Hadoop 2.6.0发行版——...
大数据/Linux安装包-hadoop-2.6.0-cdh5.15.1.tar.gz 大数据/Linux安装包-hadoop-2.6.0-cdh5.15.1.tar.gz 大数据/Linux安装包-hadoop-2.6.0-cdh5.15.1.tar.gz
在这个hadoop-2.6.0的Windows版本中,我们关注的是bin目录下的几个关键组件:hadoop.dll、winutils.exe以及整个hadoop-2.6.0\bin目录。 1. **hadoop.dll**: 这是一个动态链接库文件,对Hadoop在Windows环境中的运行...
Hadoop 2.6.0是Hadoop发展过程中的一个重要版本,它在Hadoop 2.x系列中引入了许多改进和优化,包括提升系统性能、增强容错性和稳定性,以及提供了更丰富的功能。CDH(Cloudera Distribution Including Apache Hadoop...
6. **运行和调试**:写好代码后,右键点击项目,选择"Hadoop" > "Run on Cluster"或"Debug on Cluster",Eclipse会自动将你的程序提交到Hadoop集群上运行。你可以在"Console"视图中查看运行日志,也可以在...
这个压缩包 "sqoop-1.4.7.bin__hadoop-2.6.0.tar" 包含了 Sqoop 的 1.4.7 版本,该版本是针对 Hadoop 2.6.0 的。对于那些不想通过官方网站下载的用户,这是一个方便的选择。 在 Hadoop 生态系统中,Sqoop 提供了一...
标题中的"hadoop-2.6.0-cdh5.14.2.tar.gz"是一个针对Apache Hadoop的软件包,具体来说是CDH(Cloudera Distribution Including Apache Hadoop)5.14.2版本,它基于Hadoop 2.6.0。CDH是由Cloudera公司提供的一个开源...
本文将详细介绍这两个文件以及它们在Hadoop 2.6.0版本中的作用。 `hadoop.dll`是Hadoop在Windows环境下运行所必需的一个动态链接库(Dynamic Link Library)文件。在Linux系统中,Hadoop依赖于`libhadoop.so`这样的...
在64位系统上运行Hadoop 2.6.0会出现以下提示: 用缺省的32位native库(/opt/hadoop-2.6.0/lib/native)会出现下面的错误: 14/01/27 10:52:34 WARN util.NativeCodeLoader: Unable to load native-hadoop library for ...
hadoop-2.6.0-cdh5.14.2.tar.gz适用于Linux环境,centos7已测试
hadoop-2.6.0-src.zip源码
6. **Hadoop安装与配置**: 安装Hadoop-2.6.0-cdh5.7.0版本需要配置集群环境,包括设置环境变量、配置集群节点间通信、初始化HDFS和YARN等。同时,还需要考虑安全性、监控和性能优化等方面。 7. **Hadoop应用开发**:...
Hadoop 2.6.0是Hadoop发展过程中的一个重要版本,提供了许多改进和新特性,旨在提高系统的稳定性和性能。 在Hadoop的核心组件中,有两个关键的部分:HDFS(Hadoop Distributed File System)和MapReduce。HDFS是...
6. **docs**: 可能包含关于Hadoop的文档和API参考。 7. **hadoop-mapreduce**: MapReduce相关组件,包括JobTracker和TaskTracker的实现。 8. **hadoop-hdfs**: HDFS的相关组件,如NameNode和DataNode。 9. **hadoop-...
6. **验证安装**:使用`hadoop fs -ls /`命令检查HDFS是否正常运行,如果能看到默认的/hadoop目录,说明HDFS已经启动成功。 7. **关闭Hadoop**:在不使用Hadoop时,应通过`stop-dfs.sh`和`stop-yarn.sh`脚本停止...
带编译所需的maven库,hadoop-2.6.0-cdh5.15.2在CentOS Linux release 7.3.1611重新编译的版本
6. 配置Hadoop环境: 编辑`/opt/hadoop-2.6.0-cdh5.7.0/etc/hadoop/hadoop-env.sh`,设置HADOOP_HOME和JAVA_HOME: ``` export HADOOP_HOME=/opt/hadoop-2.6.0-cdh5.7.0 export JAVA_HOME=/opt/jdk1.7.0_80 ```...
Hadoop 2.6.0是Hadoop发展中的一个重要版本,它带来了许多性能改进、稳定性和功能增强。这个"hadop 2.6.0 安装包"是为了帮助用户搭建和配置Hadoop环境,特别适用于大数据处理和分析。 1. **Hadoop的核心组件** - *...
hadoop-2.6.0.tar.gz.mds,hadoop的安装包,版本为2.6.0,适应操作系统为Linux。