`

hadoop安装过程

 
阅读更多

 2.1系统环境: 

    宿主机器:

        CPUIntel(R) Core™ i3 CPU M 380 @ 2.53GHz

        内存:4G

        硬盘:500G

        操作系统:Win7  32Bit 无线上网

    Linux 版本:

        CentOS-6.3-i386-minimal

    虚拟机版本

        VirtualBox 4.2.12

        采用host-only上网方式

    计划安装3CentOS虚拟机,实现完整分布式模式。

    hadoop1,hadoop2,hadoop3 分别内存为512M,硬盘容量为10G。

     环境如下:

 

    虚拟机版本号:
   

  虚拟机ip地址:

  

2.2 hadoop具体安装过程:

    安装wget:

 

    安装jdk

 

 

 

配置java环境变量

vi /etc/profile 添加:

JAVA_HOME=/usr/java/jdk1.6.0_45

PATH=$PATH:$JAVA_HOME/bin

CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar

export PATH JAVA_HOME CLASSPATH

 

source /etc/profile使配置生效

 

新增hadoop用户,并配置密码。

 

 关闭本虚拟机。

halt –p

 

复制虚拟机

复制hadoop1

 

 同样复制hadoop2,hadoop3

 

通过VirtualBox的新建功能把刚才hadoop1-3创建到虚拟机中。

设置虚拟机启用PAE/NX

 

虚拟机启动后:

    rm /etc/udev/rules.d/70-persistent-net.rules

    重启

然后配置虚拟机ip:

    vi /etc/sysconfig/network-scripts/ifcfg-eth0

 

配置结果如下:

    hadoop1:192.168.137.3

    hadoop2:192.168.137.4

    hadoop3:192.168.137.5

配置ssh互信

     首先配置host,便于以后用主机名直接访问各主机,省去了输入IP地址的麻烦

    vi /etc/hosts  添加内容如下,三台机器配置相同:

  192.168.137.3   hadoop1.localdomain     hadoop1
  192.168.137.4   hadoop2.localdomain     hadoop2
  192.168.137.5   hadoop3.localdomain     hadoop3

各项以tab键隔开。

    重启生效

 

   登陆每台机器执行生成密钥命令。

将所有的公钥文件 id_rsa.pub汇总到一个总的认证文件authorized-keys中

chmod 700 ~/.ssh

chmod 600 ~/.ssh/authorized_keys 

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

ssh hadoop@hadoop2 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

ssh hadoop@hadoop3 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

目前hadoop1上存在一份完整的认证key文件,这时候,把她拷到hadoop2,hadoop3主机的对应目录下

 验证:

SSH互信配置完成。

配置hadoop

    回到hadoop1虚拟机内,使用wget 命令下载hadoop 0.20

     wget http://mirror.bjtu.edu.cn/apache/hadoop/common/stable/hadoop-1.0.4.tar.gz


解压

 

创建tmp文件夹

 

配置core-site.xml文件

修改Hadoop核心配置文件core-site.xml,这里配置的是HDFS的地址和端口号。

vi /home/hadoop/hadoop-1.0.4/conf/core-site.xml

 

配置hdfs-site.xml文件

修改Hadoop中HDFS的配置,配置的备份方式默认为3。

 配置mapred-site.xml文件

修改Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端配置的是JobTracker的地址和端口。

 

配置masters文件

 

 配置slaves文件(Master主机特有

 

配置hadoop-env.sh 添加export JAVA_HOME=/usr/java/jdk1.6.0_45

 

现在在Master机器上的Hadoop配置就结束了,剩下的就是配置Slave机器上的Hadoop。

把Hadoop文件夹复制到其他机器的"/home/hadoop"目录下,然后根据实际情况进行配置,不要配置slaves文件

scp ~/.ssh/authorized_keys hadoop@hadoop2:~/.ssh/

scp ~/.ssh/authorized_keys hadoop@hadoop3:~/.ssh/

 

格式化namenode

这一步在主结点master上进行操作:

 

启动hadoop

在启动前关闭集群中所有机器的防火墙

这一步也在主结点master上进行操作:

 用jps检验各后台进程是否成功启动

在主结点上查看namenode,jobtracker,secondarynamenode进程是否启动。

正常

在hadoop2和hadoop3上

至此,hadoop完整分布式模式安装完成。

 

 

分享到:
评论

相关推荐

    HADOOP安装过程

    ### Hadoop安装过程详解 #### 一、概述 Hadoop是一种能够处理大量数据的大规模分布式存储与计算框架,常用于构建大数据分析平台。本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的...

    最详尽的Hadoop安装过程

    ### Hadoop安装与配置详解 #### 一、前言 Hadoop是一款开源软件框架,用于分布式存储和处理大型数据集。本文将详细介绍如何在CentOS 5.5环境下搭建一个包含1个NameNode节点和2个DataNode节点的Hadoop集群,并通过一...

    hadoop的安装

    标题《hadoop的安装》所涉及的知识点涵盖Hadoop安装过程中的各个方面,包括但不限于JDK环境的配置与安装、Hadoop下载、解压、配置以及启动等步骤。以下是根据给定内容和描述生成的详细知识点: 1. JDK环境配置与...

    hadoop安装中的网络配置

    本文将详细图解了 hadoop 安装过程中的网络配置,实现了 hadoop 虚拟机、宿主机、外网三者互通。 网络模式 在 hadoop 安装过程中,需要选择合适的网络模式,共有三种网络模式:bridge(桥接方式)、nat(网络地址...

    hadoop安装过程中的问题

    (这是Hadoop的基础) ...3./etc/host 里配置 master和slaves 4.修改/etc/hostname 主机名 5、/etc/profile的java和Hadoop配置路径 6.hadoop namenode format 7./hadoop/etc/slaves这个...安装ssh和解决jdk找不到path问腿

    Hadoop课程实验和报告——Hadoop安装实验报告

    Hadoop课程实验和报告——Hadoop安装实验报告 Hadoop是一个开源的大数据处理框架,由Apache基金会开发和维护。它提供了一种可靠、可扩展、可高效的方法来存储和处理大规模数据。在本实验报告中,我们将介绍Hadoop的...

    hadoop伪分布式安装过程截图

    9. **截图的参考价值**:提供的截图可能展示了每个步骤的关键界面,包括配置文件的编辑、命令行的输出以及服务的启动状态等,对于初学者来说,这些都是直观理解Hadoop安装过程的重要视觉辅助。 10. **常见问题与...

    linux下载,安装,JDK配置,hadoop安装

    ### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...

    单机版hadoop安装(linux)

    在这个安装过程中,我们将创建 Hadoop 用户组和用户,安装 JDK,配置环境变量,安装 SSH 服务,并最终安装 Hadoop。 1. 创建 Hadoop 用户组和用户 创建 Hadoop 用户组和用户是单机版 Hadoop 安装的第一步。在 ...

    Hadoop2.7.7安装过程

    在安装过程中,我们会遇到各种问题,但通过学习和实践,我们可以克服这些困难,从而深入理解Hadoop及其依赖环境。 首先,安装Hadoop的第一步是创建一个专门的用户账户。在本例中,创建了一个名为"hadoop"的用户,这...

    实验1 安装Hadoop.doc

    - 安装过程相对简单,按照官方指南或软件提示操作即可。 2. **安装或导入Ubuntu系统**: - 在VirtualBox中安装Ubuntu的具体步骤可参考相关书籍资料(例如《大数据基础编程、实验和案例教程》P18—P30)。 - 如需...

    hadoop安装

    在本节中,我们将详细介绍 Hadoop 的安装过程。 一、安装 JDK Hadoop 需要 Java 环境的支持,因此我们需要首先安装 JDK。这里,我们使用的是 Oracle 的 JDK。 1. 安装 JDK 首先,我们需要将 JDK 的安装包下载到 ...

    Hadoop安装和配置

    ### Hadoop安装与配置详解 #### 一、概述 Hadoop是一个开源软件框架,用于分布式存储和处理大数据集。它能够高效地处理PB级别的数据,适用于海量数据的存储和计算场景。本文将详细介绍如何在多台虚拟机上安装和...

    Hadoop安装核心配置文件

    Hadoop安装过程下的配置文件是指在Hadoop安装过程中所需的核心配置文件,这些文件对Hadoop的正常运行至关重要。核心配置文件包括core-site.xml和yarn-site.xml的配置。下面我们将详细介绍这些配置文件的作用和配置...

    hadoop完全安装手册

    ##### 2.3 Hadoop安装与配置 1. **下载与解压Hadoop**:下载Hadoop压缩包,并解压到指定目录。 2. **配置环境变量**:在`/etc/profile.d/hadoop.sh`中添加Hadoop的环境变量。 3. **配置hadoop-env.sh**:配置JDK的...

    hadoop安装环境套件

    6. **链接.txt**:这个文件可能包含了Hadoop安装过程中的额外链接资源,比如官方文档、教程或者论坛讨论,有助于用户获取更多的帮助信息。 7. **hadooponwindows-master.zip**:这可能是Hadoop在Windows系统上安装...

    centos安装hadoop超级详细

    SSH(Secure Shell)是一种用于远程控制的协议,Hadoop安装过程中需要用到它。因此,确保SSH已经安装并且配置为无密码登录是非常重要的。 1. **检查SSH安装**:可以通过`rpm -qa | grep ssh`命令查看是否已经安装了...

Global site tag (gtag.js) - Google Analytics