2.1系统环境:
宿主机器:
CPU:Intel(R) Core™ i3 CPU M 380 @ 2.53GHz
内存:4G
硬盘:500G
操作系统:Win7 32Bit 无线上网
Linux 版本:
CentOS-6.3-i386-minimal
虚拟机版本
VirtualBox 4.2.12
采用host-only上网方式
计划安装3个CentOS虚拟机,实现完整分布式模式。
hadoop1,hadoop2,hadoop3 分别内存为512M,硬盘容量为10G。
环境如下:
虚拟机版本号:
虚拟机ip地址:
2.2 hadoop具体安装过程:
安装wget:
安装jdk
配置java环境变量
vi /etc/profile 添加:
JAVA_HOME=/usr/java/jdk1.6.0_45
PATH=$PATH:$JAVA_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
export PATH JAVA_HOME CLASSPATH
source /etc/profile使配置生效
新增hadoop用户,并配置密码。
关闭本虚拟机。
halt –p
复制虚拟机
复制hadoop1
同样复制hadoop2,hadoop3
通过VirtualBox的新建功能把刚才hadoop1-3创建到虚拟机中。
设置虚拟机启用PAE/NX
虚拟机启动后:
rm /etc/udev/rules.d/70-persistent-net.rules
重启
然后配置虚拟机ip:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
配置结果如下:
hadoop1:192.168.137.3
hadoop2:192.168.137.4
hadoop3:192.168.137.5
配置ssh互信
首先配置host,便于以后用主机名直接访问各主机,省去了输入IP地址的麻烦
vi /etc/hosts 添加内容如下,三台机器配置相同:
192.168.137.3 hadoop1.localdomain hadoop1
192.168.137.4 hadoop2.localdomain hadoop2
192.168.137.5 hadoop3.localdomain hadoop3
各项以tab键隔开。
重启生效
登陆每台机器执行生成密钥命令。
将所有的公钥文件 id_rsa.pub汇总到一个总的认证文件authorized-keys中
chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh hadoop@hadoop2 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh hadoop@hadoop3 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
目前hadoop1上存在一份完整的认证key文件,这时候,把她拷到hadoop2,hadoop3主机的对应目录下
验证:
SSH互信配置完成。
配置hadoop
回到hadoop1虚拟机内,使用wget 命令下载hadoop 0.20
wget http://mirror.bjtu.edu.cn/apache/hadoop/common/stable/hadoop-1.0.4.tar.gz
解压
创建tmp文件夹
配置core-site.xml文件
修改Hadoop核心配置文件core-site.xml,这里配置的是HDFS的地址和端口号。
vi /home/hadoop/hadoop-1.0.4/conf/core-site.xml
配置hdfs-site.xml文件
修改Hadoop中HDFS的配置,配置的备份方式默认为3。
配置mapred-site.xml文件
修改Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端配置的是JobTracker的地址和端口。
配置masters文件
配置slaves文件(Master主机特有)
配置hadoop-env.sh 添加export JAVA_HOME=/usr/java/jdk1.6.0_45
现在在Master机器上的Hadoop配置就结束了,剩下的就是配置Slave机器上的Hadoop。
把Hadoop文件夹复制到其他机器的"/home/hadoop"目录下,然后根据实际情况进行配置,不要配置slaves文件
scp ~/.ssh/authorized_keys hadoop@hadoop2:~/.ssh/
scp ~/.ssh/authorized_keys hadoop@hadoop3:~/.ssh/
格式化namenode
这一步在主结点master上进行操作:
启动hadoop
在启动前关闭集群中所有机器的防火墙
这一步也在主结点master上进行操作:
用jps检验各后台进程是否成功启动
在主结点上查看namenode,jobtracker,secondarynamenode进程是否启动。
正常
在hadoop2和hadoop3上
至此,hadoop完整分布式模式安装完成。
相关推荐
### Hadoop安装过程详解 #### 一、概述 Hadoop是一种能够处理大量数据的大规模分布式存储与计算框架,常用于构建大数据分析平台。本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的...
### Hadoop安装与配置详解 #### 一、前言 Hadoop是一款开源软件框架,用于分布式存储和处理大型数据集。本文将详细介绍如何在CentOS 5.5环境下搭建一个包含1个NameNode节点和2个DataNode节点的Hadoop集群,并通过一...
标题《hadoop的安装》所涉及的知识点涵盖Hadoop安装过程中的各个方面,包括但不限于JDK环境的配置与安装、Hadoop下载、解压、配置以及启动等步骤。以下是根据给定内容和描述生成的详细知识点: 1. JDK环境配置与...
本文将详细图解了 hadoop 安装过程中的网络配置,实现了 hadoop 虚拟机、宿主机、外网三者互通。 网络模式 在 hadoop 安装过程中,需要选择合适的网络模式,共有三种网络模式:bridge(桥接方式)、nat(网络地址...
(这是Hadoop的基础) ...3./etc/host 里配置 master和slaves 4.修改/etc/hostname 主机名 5、/etc/profile的java和Hadoop配置路径 6.hadoop namenode format 7./hadoop/etc/slaves这个...安装ssh和解决jdk找不到path问腿
Hadoop课程实验和报告——Hadoop安装实验报告 Hadoop是一个开源的大数据处理框架,由Apache基金会开发和维护。它提供了一种可靠、可扩展、可高效的方法来存储和处理大规模数据。在本实验报告中,我们将介绍Hadoop的...
9. **截图的参考价值**:提供的截图可能展示了每个步骤的关键界面,包括配置文件的编辑、命令行的输出以及服务的启动状态等,对于初学者来说,这些都是直观理解Hadoop安装过程的重要视觉辅助。 10. **常见问题与...
### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...
在这个安装过程中,我们将创建 Hadoop 用户组和用户,安装 JDK,配置环境变量,安装 SSH 服务,并最终安装 Hadoop。 1. 创建 Hadoop 用户组和用户 创建 Hadoop 用户组和用户是单机版 Hadoop 安装的第一步。在 ...
在安装过程中,我们会遇到各种问题,但通过学习和实践,我们可以克服这些困难,从而深入理解Hadoop及其依赖环境。 首先,安装Hadoop的第一步是创建一个专门的用户账户。在本例中,创建了一个名为"hadoop"的用户,这...
- 安装过程相对简单,按照官方指南或软件提示操作即可。 2. **安装或导入Ubuntu系统**: - 在VirtualBox中安装Ubuntu的具体步骤可参考相关书籍资料(例如《大数据基础编程、实验和案例教程》P18—P30)。 - 如需...
在本节中,我们将详细介绍 Hadoop 的安装过程。 一、安装 JDK Hadoop 需要 Java 环境的支持,因此我们需要首先安装 JDK。这里,我们使用的是 Oracle 的 JDK。 1. 安装 JDK 首先,我们需要将 JDK 的安装包下载到 ...
### Hadoop安装与配置详解 #### 一、概述 Hadoop是一个开源软件框架,用于分布式存储和处理大数据集。它能够高效地处理PB级别的数据,适用于海量数据的存储和计算场景。本文将详细介绍如何在多台虚拟机上安装和...
Hadoop安装过程下的配置文件是指在Hadoop安装过程中所需的核心配置文件,这些文件对Hadoop的正常运行至关重要。核心配置文件包括core-site.xml和yarn-site.xml的配置。下面我们将详细介绍这些配置文件的作用和配置...
##### 2.3 Hadoop安装与配置 1. **下载与解压Hadoop**:下载Hadoop压缩包,并解压到指定目录。 2. **配置环境变量**:在`/etc/profile.d/hadoop.sh`中添加Hadoop的环境变量。 3. **配置hadoop-env.sh**:配置JDK的...
6. **链接.txt**:这个文件可能包含了Hadoop安装过程中的额外链接资源,比如官方文档、教程或者论坛讨论,有助于用户获取更多的帮助信息。 7. **hadooponwindows-master.zip**:这可能是Hadoop在Windows系统上安装...
SSH(Secure Shell)是一种用于远程控制的协议,Hadoop安装过程中需要用到它。因此,确保SSH已经安装并且配置为无密码登录是非常重要的。 1. **检查SSH安装**:可以通过`rpm -qa | grep ssh`命令查看是否已经安装了...