一,
ubuntu-14.04.3-desktop-amd64(32位的总是报不能识别系统的jvm等错误)
至少1G内存
相关链接
http://www.tuicool.com/articles/bmeUneM
二,
安装JDK
http://fulndon.iteye.com/blog/2276974
安装ssh和无密码登录
http://blog.csdn.net/hackerwin7/article/details/28109073
使用shell下载
wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz
tar -zxvf hadoop-2.7.1.tar.gz
三,对hadoop2.7.1/etc/hadoop下的相关配置文件进行配置
一 core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/home/sijiu/program/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
二 mapred-site.xml.template
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
三 hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/sijiu/program/hadoop/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/sijiu/program/hadoop/tmp/dfs/data</value>
</property>
</configuration>
三, 运行
1.初始化HDFS系统
在hadop2.7.1目录下使用如下命令:
bin/hdfs namenode -format
2.开启 NameNode 和 DataNode 守护进程
使用如下命令开启:
sbin/start-dfs.sh,
若启动时报找不到JAVA_HOME的错误,将JAVA_HOME的真实路径替换掉hadoop-env.sh中的${JAVA_HOME}
3.查看进程信息
使用如下命令查看进程信息
jps,正常可以看到namenode,datanode,secondarynamenode,jps四个进程
遇到的问题:查看日志启动正常,但看到的进程不全,解决:重新格式化hdfs,切换到root用户(我曾用root用户启动过)结束hadoop运行
44.查看Web UI
在浏览器中输入 http://机器ip:50070
分享到:
相关推荐
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
本文将指导您如何在Ubuntu 14.04 64位系统上安装Hadoop 2.6.0,无论是单机模式还是伪分布式模式,旨在帮助初学者克服安装过程中的障碍。 **环境准备** 首先,确保您的系统是Ubuntu 14.04 64位。如果使用的是其他...
根据给定文件的信息,本文将详细介绍如何在 CentOS 6.4 系统中安装 Hadoop 2.6.0,并实现单机模式与伪分布式模式的配置。 ### 环境准备 #### 操作系统环境 - **操作系统**: CentOS 6.4 32位 - **虚拟化平台**: ...
《Hadoop-2.7.1分布式安装手册》是一份详尽的指南,旨在帮助用户在不同的模式下安装和配置Apache Hadoop 2.7.1。Hadoop是开源的大数据处理框架,它允许在廉价硬件上进行大规模数据处理,具有高容错性和可扩展性。这...
本文将深入探讨Hadoop Common 2.7.1与HBase 2.0.0之间的关系,以及在Windows环境下如何正确安装和配置这两个组件。 Hadoop是Apache软件基金会开发的一个开源框架,主要用于处理和存储大规模数据集。Hadoop Common是...
本教程适用于Hadoop 2.x系列版本,特别是Hadoop 2.6.0及类似版本如Hadoop 2.7.1、Hadoop 2.4.1。它假设读者已经具备了Hadoop单机或伪分布式配置的基础知识。 **环境配置** 教程以Ubuntu 14.04 64位作为示例操作系统...
7. **单机模式与伪分布式模式**: 对于学习和测试,Windows用户可以选择单机模式,所有服务都在同一台机器上运行。若要模拟分布式环境,可以启用伪分布式模式,其中NameNode、DataNode、ResourceManager和NodeManager...
Hadoop支持三种主要的部署模式:单机模式、伪分布式模式以及分布式模式。 1. **单机模式**: - **定义**:这是Hadoop默认的运行模式,无需额外配置即可运行。 - **特点**:所有Hadoop进程都在同一个Java进程中...
【Hadoop系统安装运行与程序开发】是学习大数据技术的基础环节,主要涵盖了四个核心部分:单机Hadoop系统安装、集群Hadoop系统安装、Hadoop集群远程作业提交与执行以及Hadoop MapReduce程序开发。本章节详细介绍了...
此版本适用于单机模式下的测试与学习。 4. **解压缩Hadoop**:将下载的Hadoop包解压到D盘,路径为`D:\hadoop2.7.3`。 5. **设置HADOOP_HOME环境变量**:创建新的环境变量HADOOP_HOME,值为Hadoop的安装路径,例如`D:...
解压后,Hadoop即可在单机模式下运行。 4. **环境变量配置**:为了使Hadoop命令能在终端中正常执行,需要配置环境变量。这涉及到修改用户目录下的`.bashrc`文件。修改后,通过`source ./bashrc`来更新环境变量。 5...