`

hadoop集群部署

 
阅读更多

1) 安装jdk 
下载jdk-6u21-linux-i586.bin 
然后修改/etc/profile: 

export JAVA_HOME=/usr/local/jdk  
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH  
export PATH=$PATH:$JAVA_HOME/bin  

保存,并执行source /etc/profile 

2) 配置host 
Namenode的机器,需要配置集群中所有机器的ip 
修改/etc/hosts 

10.10.236.190   master  
10.10.236.191   slave-A  
10.10.236.193   slave-B  

 

其他的datanode的/etc/hosts 只需要配置namenode的机器ip和本机ip 

10.10.236.190   master  
10.10.236.191   slave-A  


修改hostname(可选) 
vi /proc/sys/kernel/hostname 

3) 建立ssh无密码登录 
首先进到root目录下  

root@master:~# $ssh-keygen  -t  rsa 

 

进入.ssh目录 

root@master:~/.ssh# cp id_rsa.pub authorized_keys  

 

其余的datanode的机器 
新建.ssh目录 

root@slave-A:~# mkdir .ssh  

在name(master)上远程拷贝 

root@master:~/.ssh# scp authorized_keys slave-A:/root/.ssh/  

 

测试ssh 

4) 安装hadoop 
下载Hadoop 解压到每台服务器的/data/soft 
解压

root@master:/data/soft# tar zxvf hadoop-0.21.0.tar.gz  

建立软连

root@master:/data/soft# ln -s hadoop-0.21.0 hadoop  

 

然后修改/etc/profile 

export HADOOP_HOME=/data/soft/hadoop  
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin  

 

5) 配置hadoop 
1.修改conf/hadoop-env.sh,添加jdk支持

export JAVA_HOME=/usr/local/jdk  

  如果ssh端口不是默认的22,在conf/hadoop-env.sh里改下。如:

export HADOOP_SSH_OPTS="-p 1234"

 

2.修改conf/core-site.xml,增加下面内容 
   

复制代码
<property>   
        <name>fs.default.name</name>    
        <value>hdfs://master:54310</value> //这个才是真正决定namenode  
</property>  
<property>    
        <name>hadoop.tmp.dir</name>    
        <value>/data/hdfs/tmp</value>  //临时文件,有问题的时候,可以删除  
        <description>A base for other temporary directories.</description>  
</property>  
复制代码

 

3.修改conf/hdfs-site.xml,增加下面内容 

复制代码
<property>  
        <name>dfs.name.dir</name>  
        <value>/data/hdfs/name</value> //namenode持久存储名字空间,事务日志的本地路径  
</property>  
<property>  
        <name>dfs.data.dir</name>  
        <value>/data/hdfs/data</value> //datanode存放数据的路径  
</property>  
<property>  
        <name>dfs.datanode.max.xcievers</name>  
        <value>4096</value>  
</property>  
<property>  
        <name>dfs.replication</name>  
        <value>1</value> //数据备份的个数,默认是3  
</property>  
复制代码

 

3.修改conf/mapred-site.xml,增加下面内容 
    

<property>  
        <name>mapred.job.tracker</name> //jobTracker的主机  
        <value>master:54311</value>  
</property>  

 


4. .修改conf/masters,这个决定那个是secondarynamenode 

master

5 .修改conf/slaves,这个是所有datanode的机器 

slaves-A
slaves-B

6) 将配置好的hadoop拷贝到所有的datanode 

root@master:/data/soft/hadoop/conf# scp -rp /data/soft/hadoop-0.21.0 10.10.236.191:/data/soft/hadoop-0.21.0  

 

在datanode上建立对应的软连 

7) 格式化hdfs文件系统的namenode 

root@master:/data/soft/hadoop# bin/hadoop namenode –format  

输入Y 

8) 启动hadoop集群

root@master:/data/soft/hadoop# bin/start-all.sh 

 

9) Hdfs操作 
建立目录 

root@master:/data/soft/hadoop # bin/hadoop dfs -mkdir testdir

查看现有文件 

root@master:/data/soft/hadoop # bin/hadoop dfs -ls 

10) 关闭Hdfs

root@master:/data/soft/hadoop# bin/stop-all.sh 
分享到:
评论

相关推荐

    hadoop 集群部署操作

    Hadoop 集群部署操作 Hadoop 集群部署操作是指规划、安装和配置 Hadoop 集群的整个过程,以便在生产环境中运行 Hadoop 应用程序。下面是 Hadoop 集群部署操作的详细知识点: 规划 Hadoop 集群 * 规划主机名:...

    Hadoop集群部署方案.docx

    "Hadoop集群部署方案" Hadoop 集群部署方案是指在分布式系统中部署 Hadoop 集群的详细步骤和配置过程。下面是该方案的详细知识点解释: 1. Hadoop 简介 Hadoop 是Apache软件基金会旗下的开源项目,主要用于大数据...

    实验报告二:Hadoop集群部署前期准备-实验报告模板.docx

    ### Hadoop集群部署前期准备知识点解析 #### 一、实验目的 本次实验旨在为Hadoop集群的部署做好前期准备工作,并在此基础上撰写实验报告。主要内容包括但不限于添加Hadoop用户及其权限管理、配置网络环境、禁用可能...

    Hadoop集群部署、实战等相关培训资料

    本压缩包文件包含了一系列关于Hadoop集群部署、实战应用以及相关技术的详细资料,对于想要深入了解和掌握Hadoop技术的人来说,是非常宝贵的资源。 首先,我们来看《EasyHadoop集群部署文档.doc》。这份文档通常会...

    最新Hadoop集群部署(最全面).docx

    Hadoop集群部署知识点详解 Hadoop集群部署是大数据处理的核心组件之一,正确的部署可以确保集群的高可用性和高性能。本文将详细介绍Hadoop集群部署的各个步骤,并对关键技术点进行解析。 一、先决条件 在开始...

    Hadoop集群部署完整版

    Hadoop集群部署完整版 Hadoop是一款开源的大数据处理框架,主要用于存储和处理大量的数据。Hadoop集群部署是指在多台服务器上部署Hadoop,以实现高可用性、高性能和高 Scalability的大数据处理。 Hadoop简介 ...

    机房hadoop集群部署

    "机房Hadoop集群部署"是一个复杂的过程,涉及到硬件准备、软件安装、配置优化以及系统测试等多个环节。以下是对这一主题的详细阐述: 1. **硬件规划**:机房中的Hadoop集群通常由多台服务器组成,包括NameNode(主...

    hadoop集群部署手册

    ### Hadoop集群部署手册知识点详解 #### 一、实验背景与目标 本次实验的主要目的是让学习者能够掌握从零开始配置Hadoop-0.21集群的方法。通过本实验,参与者不仅能了解Hadoop集群的基本组成及其工作原理,还能实际...

    最新Hadoop集群部署(最全面).pdf

    Hadoop 集群部署详解 Hadoop 集群部署是大数据处理和存储的关键步骤,以下是 Hadoop 集群部署的详细说明: 1. NameNode 和 JobTracker 的角色 在 Hadoop 集群中,一台机器被指定为 NameNode,另一台不同的机器被...

    hadoop集群部署之双虚拟机版

    ### Hadoop集群部署之双虚拟机版 #### 一、概述 本文主要介绍如何通过一台物理机器开启两个虚拟机的方式,构建一个简单的Hadoop集群。该集群由一个名为`shenghao`的主节点(Namenode)和一个名为`slave`的从节点...

    Hadoop集群搭建部署与MapReduce程序关键点个性化开发.doc

    首先,我们来看任务1——Hadoop集群的部署。这一步至关重要,因为它为整个大数据处理系统提供了基础架构。在虚拟机中安装Ubuntu Kylin 16.04.4是常见的选择,因为这是一个稳定且支持Hadoop的Linux发行版。安装完成后...

    Hadoop集群部署文档

    【Hadoop集群部署文档】 Hadoop是一个开源的分布式计算框架,允许在大规模集群上处理大量数据。本文档基于作者的实际部署经验,详细介绍了在多台机器上构建Hadoop集群的步骤,特别适合初学者和寻求深入理解Hadoop...

    Hadoop集群部署及测试实验(三).docx

    ### Hadoop集群部署及测试实验知识点总结 #### 一、实验背景与目标 **实验标题:** Hadoop集群部署及测试实验(三) **实验描述:** 本次实验旨在通过JAVA API实现MapReduce的经典案例——倒排索引,进一步熟悉...

    Hadoop集群部署实例

    由于工作需要,最近一段时间开始接触学习 Hadoop 相关的东西,目前公司的实时任务和离线任务都跑在一个 Hadoop 集群,离线 任务的特点就是每天定时跑,任务跑完了资源就空闲了,为了合理的利用资源,我们打算在搭一...

    Hadoop集群部署及测试实验(一).docx

    ### Hadoop集群部署及测试实验知识点详述 #### 一、实验目的与要求 本实验旨在让学生通过实际操作,深入了解并掌握Hadoop集群的基本安装、配置及简单的测试过程。具体目标包括: 1. **理解虚拟机环境搭建**: - ...

    Hadoop集群部署研究.docx

    2.3 Hadoop 集群的测试与优化一旦集群部署完毕,进行基本的功能测试是非常重要的,如创建文件系统目录、上传数据、运行 MapReduce 示例任务等。这些操作有助于验证 Hadoop 集群的正确性和可用性。同时,根据实际需求...

    Hadoop集群部署及测试实验(二).docx

    ### Hadoop集群部署及测试实验知识点 #### 一、实验目标与要求 本实验旨在深入学习和实践Hadoop分布式文件系统(HDFS)的操作方法和技术细节。通过本实验,参与者将能够掌握以下技能: 1. **熟悉CentOS环境下的...

    大数据环境中Hadoop集群部署与配置

    内容概要:本文档详细介绍了如何在Linux环境下配置和部署Hadoop集群。内容涵盖了连接比赛节点、修改主机名和配置、关闭防火墙、配置时间同步、安装JDK和Hadoop、配置Hadoop环境变量、格式化NameNode、启动Hadoop集群...

Global site tag (gtag.js) - Google Analytics