`
samwalt
  • 浏览: 285533 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Linux集群上安装hadoop

阅读更多
两台机器组成一个小实验集群,一台master,一台slave1。

OS: Red Hat Enterprise Linux 5
Java: jdk1.6
hadoop: 0.20.2

master机器的配置情况:
编辑/etc/hosts文件,加上master和slave1的ip地址
编辑hadoop-0.20.2/conf/masters文件,加上"master"
编辑hadoop-0.20.2/conf/slaves文件,加上"slave1"
编辑hadoop-0.20.2/conf/hadoop-env.sh文件,
加上JAVA_HOME路径:
export JAVA_HOME=/usr/java6/jdk1.6.0_20



即使是配置伪分布式模式,也需要安装ssh

sudo apt-get install openssh-server



编辑hadoop-0.20.2/conf/core-site.xml文件,
       
        <property>
                <name>fs.default.name</name>
                <value>hdfs://master:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/hadoop/tmp</value> <!-- 此目录是本地文件系统路径,hdfs上也会生成相同路径 -->
        </property>


如果是伪分布式,core-site.xml文件这样配置:
        <property>
                <name>fs.default.name</name>
                <value>hdfs://localhost:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/hadoop/tmp</value>
        </property>


编辑hadoop-0.20.2/conf/hdfs-site.xml文件,
   <property>
       <name>dfs.replication</name>
       <value>2</value>  <!-- 伪分布式就配成1 -->
   </property>

   <property>
       <name>dfs.name.dir</name>
       <value>/home/hadoop/tmp/dfs/name</value> <!-- 本地文件系统路径 -->
   </property>

   <property>
       <name>dfs.data.dir</name>
       <value>/home/hadoop/tmp/dfs/data</value> <!-- 本地文件系统路径 -->
   </property>




编辑hadoop-0.20.2/conf/mapred-site.xml文件,
        <property>
                <name>mapred.job.tracker</name>
                <value>master:9001</value>
        </property>
        <property>
                <name>mapred.job.reuse.jvm.num.tasks</name>
                <value>10</value>
        </property>


启动hadoop之前要格式化namenode
hadoop namenode -format


在master上执行start-all.sh脚本,如果slave1机器上的java进程不能启动。
解决方法:关闭防火墙,
service iptables stop


机器需要用ssh来启动和停止各个datanode上的进程,而且是不输入密码的方式,故需要配置SSH使用无密码公钥认证的方式。
在namenode上需要生成一个密钥对,即一个私钥,一个公钥。将公钥拷贝到datanode上,这样,比如当namenode向datanode发起ssh连接的时候,datanode上就会生成一个随机数并用namenode的公钥对这个随机数进行加密,并发送给namenode;namenode收到这个加密的数以后用私钥进行解密,并将解密后的数发送回datanode,datanode确认解密的数无误后就允许namenode进行连接了。这就完成了一次公钥认证过程。

首先在namenode上用rsa算法生成密钥对:
ssh-keygen -t rsa

也可以用dsa算法
ssh-kengen -t dsa


这个命令将为namenode上的登录用户生成其密钥对,询问其保存路径时直接回车采用默认路径,当提示要为生成的密钥输入passphrase的时候,直接回车,也就是将其设定为空密码。生成的密钥对id_rsa,id_rsa.pub,默认存储在.ssh目录下。然后将id_rsa.pub的内容复制到每个机器(也包括本机)的.ssh/authorized_keys文件中,如果机器上已经有authorized_keys这个文件了,就在文件末尾加上id_rsa.pub中的内容,如果没有authorized_keys这个文件,直接cp或者scp就好了。

下面的操作假设各个机器上都没有authorized_keys文件。
chmod 644 authorized_keys

必须保证authorized_keys只对其所有者有读写权限,其他人不允许有写的权限,否则SSH是不会工作的。

至此各个机器上的SSH配置已经完成,可以测试一下了,比如namenode向datanode发起ssh连接
ssh slave1

别忘了测试本机
ssh master

分享到:
评论

相关推荐

    Linux系统上安装Hadoop的详细步骤

    Linux系统上安装Hadoop的详细步骤,该文档详细的描述了在linux上面如何安装hadoop,如何信息配置,初始化,启动hadoop等等,喜欢的朋友可以拿去使用

    Linux下Hadoop集群安装指南

    Linux 下 Hadoop 集群安装指南 一、Linux 下 Hadoop 集群安装前的准备工作 在开始安装 Hadoop 集群之前,我们需要安装 VMware 和 Ubuntu Linux 作为操作系统。这一步骤非常重要,因为 Hadoop 集群需要在 Linux ...

    Linuxhadoop集群安装

    总的来说,Linux上的Hadoop集群安装涉及到多步骤的配置和调试,需要对Linux系统和Java有一定了解。通过这些文档,用户可以逐步学习并掌握Hadoop的安装和管理,从而构建起自己的大数据处理平台。记住,实践是检验真理...

    在linux环境安装hadoop集群

    "在 Linux 环境安装 Hadoop 集群" 在 Linux 环境中安装 Hadoop 集群是大数据处理和分析的重要步骤。Hadoop 是 Apache 基金会开发的一款开源的分布式计算框架,能够处理大量数据。下面是安装 Hadoop 集群的详细步骤...

    Linux中安装配置hadoop集群.md

    亲测自己配置的Linux中安装配置hadoop集群

    Linux上安装Hadoop集群.pdf

    Linux上安装Hadoop集群

    hadoop集群安装笔记

    "Hadoop集群安装笔记" Hadoop集群安装笔记是一篇详细的安装指南,旨在帮助新手快速搭建Hadoop学习环境。以下是该笔记中的重要知识点: Hadoop集群安装目录 在安装Hadoop集群之前,需要准备好安装环境。安装环境...

    基于Linux平台下的Hadoop和Spark集群搭建研究.pdf

    "基于Linux平台下的Hadoop和Spark集群搭建研究" 本文主要研究了基于Linux平台下的Hadoop和Spark集群搭建,旨在提高计算速率和数据性能。Hadoop是最流行的处理平台,主要解决了数据存储和分布式计算的问题,而Spark...

    linux下载,安装,JDK配置,hadoop安装

    ### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...

    Linux系统上安装Hadoop及相关应用软件

    1、在Linux系统上安装Hadoop及相关应用软件; 2、掌握集群所有节点之间SSH免密登录配置方式; 3、掌握Hadoop集群的搭建配置流程; 4、理解Hadoop集群的原理,并掌握Hadoop集群的配置方法

    pc机连接集群的HADOOP_HOME

    标题“pc机连接集群的HADOOP_HOME”指的是在个人计算机(PC)上配置Hadoop环境,以便能够远程连接并操作一个Hadoop集群。 首先,我们来详细解释一下`HADOOP_HOME`。这是Hadoop环境中的一个重要变量,它指向Hadoop...

    docker一键安装hadoop集群

    2. **Docker 安装**:指导用户如何在他们的 Linux 系统上安装 Docker。 3. **构建 Docker 映像**:解释如何使用 Dockerfile 构建自定义的 Hadoop 映像。 4. **启动集群**:描述如何使用 `start-container.sh` 或 `...

    Linux下安装Hadoop完全分布式

    本教程提供了一个全面的指南,帮助读者了解如何在Linux环境下安装和配置Hadoop完全分布式集群。需要注意的是,实际部署过程中还可能遇到各种细节问题,如网络配置、权限管理等方面的问题,需要根据实际情况灵活处理...

    Hadoop集群安装详细步骤

    下面是在Linux平台下安装Hadoop的过程: 1. 创建安装目录:mkdir /opt/hadoop 2. 更改所属关系和权限:chown root ./; chmod 755 ./ 3. 下载项目包:wget ...

    大数据技术基础实验报告-Linux环境下hadoop集群的搭建与基本配置.doc

    - NativeCodeLoader错误:这可能是由于缺少本地库支持,需要安装对应的库,如在Ubuntu上安装`libhadoop-native-tools`。 完成上述步骤后,一个基本的Hadoop集群就在Linux环境中搭建起来了,能够进行大数据的存储和...

    脚本搭建hadoop集群

    自动化安装hadoop集群 脚本搭建hadoop集群 可以自定义主机名和IP地址 可以自定义安装jdk和hadoop(格式为*tar.gz) 注意事项 1、安装完jdk和hadoop请手动source /etc/profile 刷新环境变量 2测试脚本环境为centOS6,...

    部署全分布模式Hadoop集群 实验报告

    5. 熟练掌握在 Linux 环境下如何部署全分布模式 Hadoop 集群。 二、实验环境 本实验所需的软硬件环境包括 PC、VMware Workstation Pro、CentOS 安装包、Oracle JDK 安装包、Hadoop 安装包。 三、实验内容 1. 规划...

    linux虚拟机搭建hadoop伪分布式集群

    完成Linux系统的安装后,需要修改hostname,这在Hadoop集群中至关重要,因为节点间通信依赖于主机名。可以临时通过`hostname`命令更改,但要永久生效,需编辑`/etc/sysconfig/network`文件,设置`HOSTNAME`为所需的...

    linux下hadoop集群搭建

    在Linux环境下搭建Hadoop集群是一项复杂但至关重要的工作,它涉及到多个步骤,包括理解Hadoop的基本概念、配置网络环境、安装必要的软件以及调整系统参数。本文将深入探讨这些知识点。 首先,我们需要了解Hadoop的...

    LinuxRedHat、CentOS上搭建Hadoop集群.pdf

    搭建Hadoop集群在LinuxRedHat、CentOS上的实现 Hadoop是一种流行的开源大数据处理平台,由Google开发,现被Apache基金会维护。Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce,分别负责数据存储...

Global site tag (gtag.js) - Google Analytics