`
linleran
  • 浏览: 21952 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

Hadoop分布式集群配置总结

阅读更多
假设用2台机器配置hadoop分布式集群,192.168.11.13为主服务器namenode,192.168.11.17为数据节点datanode
1. 配置SSH的无密码公钥
192.168.11.13
用root登录
创建用户linleran:adduser linleran
设置密码:passwd linleran
切换用户:su linleran
到用户linleran的目录(/home/linleran)新建文件件.ssh:mkdir .ssh
修改目录.ssh权限为:[linleran@centos ~]$ chmod 755 .ssh
配置SSH的无密码公钥,一路回车。
[linleran@centos ~]$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/linleran/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /home/linleran/.ssh/id_rsa.
Your public key has been saved in /home/linleran/.ssh/id_rsa.pub.
The key fingerprint is:
df:99:37:84:a1:04:34:06:60:45:b9:ce:43:af:54:77 linleran@centos.test
进入.ssh目录,将id_rsa.pub的内容复制到authorized_keys后面。
修改authorized_keys的权限为 [linleran@centos .ssh]$ chmod 644 authorized_keys

192.168.11.17同样执行以内容,且将id_rsa.pub内容添加到192.168.11.13的authorized_keys后面,同时将192.168.11.13的id_rsa.pub内容添加过来,以确保2台机器相互可以ssh连接。

2.在主服务器安装hadoop
解压 tar zxvf hadoop-0.18.2.tar.gz
创建目录
/home/linleran/hadoop-0.18.2/hadoopfs/name
/home/linleran/hadoop-0.18.2/hadoopfs/data
/home/linleran/hadoop-0.18.2/tmp/
配置hadoop-env.sh设置jdk路径 export JAVA_HOME=/home/linleran/jdk1.5.0_15
配置conf/hadoop-site.xml

<configuration>
   <property>  
      <name>fs.default.name</name> 
      <value>hdfs://192.168.11.13:9000/</value>
   </property>
   <property>
      <name>mapred.job.tracker</name>
      <value>192.168.11.13:9001</value>
   </property>
   <property>
      <name>dfs.name.dir</name>
      <value>/home/linleran/hadoop-0.18.2/hadoopfs/name</value>
   </property>
   <property>
     <name>dfs.data.dir</name>
     <value>/home/linleran/hadoop-0.18.2/hadoopfs/data</value>
   </property>
   <property>
      <name>dfs.replication</name>
      <value>1</value>
   </property>
   <property>
      <name>hadoop.tmp.dir</name>
      <value>/home/linleran/hadoop-0.18.2/tmp/</value>
   </property>
</configuration>

配置conf/masters
将主机ip添加 192.168.11.13

配置conf/slaves
将datanodeIP添加 192.168.11.17

将配置好的hadoop通过scp部署到节点。
scp –r /home/linleran/hadoop-0.18.2 192.168.11.17: /home/linleran/hadoop-0.18.2

3.在主服务器启动
格式化一个新的分布式文件系统
bin/hadoop namenode –format
启动服务
bin/start-all.sh

4.测试
测试分布式文件系统
mkdir test-in
echo “hello word” > file1.txt
echo “hello hadoop” > file2.txt
bin/hadoop dfs –put test-in input
bin/hadoop jar hadoop-0.18.2-examples.jar wordcount input output
bin/hadoop dfs –get output result
cat result/*

5.配置过程中遇到的问题
SSH无密码访问不成功。.ssh目录需要755权限,authorized_keys需要644权限,否则一直提示输入密码。
Linux防火墙开着,hadoop需要开的端口需要添加,或者关掉防火墙。否则会出现节点服务器一直无法连上主服务器。节点服务器的日志不断的retry:
INFO org.apache.hadoop.ipc.Client: Retrying connect to server…
数据节点连不上主服务器还有可能是使用了机器名的缘故,还是使用IP地址比较稳妥。
分布式文件系统报错,java.lang.IllegalArgumentException: Wrong FS:,hadoop-site.xml要配置正确,fs.default.name的value是hdfs://IP:端口/,mapred.job.tracker的value是IP:端口

参考:
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/index.html
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/index.html
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop3/index.html
http://blog.csdn.net/cenwenchu79/archive/2008/08/29/2847529.aspx
http://rdc.taobao.com/blog/dw/archives/206
分享到:
评论

相关推荐

    Hadoop分布式集群配置指南

    Hadoop分布式集群配置指南 Hadoop分布式集群配置是大数据处理的关键步骤之一,本指南将指导读者成功配置一个由5台计算机构成的Hadoop集群,并成功运行wordcount处理大型数据(大于50G)。 一、Hadoop集群架构简介 ...

    hadoop 分布式集群搭建

    Hadoop分布式集群搭建的...总结来说,Hadoop分布式集群的搭建是一个涉及到硬件环境、软件安装、网络配置、系统参数调优等多方面知识的综合过程。搭建完成后,应该进行充分的测试以确保集群的稳定性和性能表现符合预期。

    大数据之hadoop分布式集群参数配置.docx

    Hadoop分布式集群参数配置 Hadoop分布式集群参数配置是大数据处理中不可或缺的一部分。本文将详细介绍Hadoop分布式集群参数配置的过程,包括master节点和slave节点的配置。 一、Hadoop分布式集群参数配置概述 ...

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程 按照文档中的操作步骤,一步步操作就可以完全实现hadoop2.2.0版本的完全分布式集群搭建过程

    大数据之hadoop分布式集群初次启动.docx

    Hadoop分布式集群初次启动 ...本文档详细讲解了Hadoop分布式集群的初次启动过程,包括配置SSH免密登录、格式化HDFS、启动HDFS和YARN模块等步骤,为读者提供了一个详细的Hadoop分布式集群搭建指南。

    大数据之hadoop分布式集群初次启动 (2).pdf

    在 Hadoop 分布式集群中,各个节点之间需要配置 SSH 免密登录,以便于集群中的节点之间可以相互通信。我们可以在 master 节点中输入命令 ssh slave1,连接到 slave1 节点,并输入 yes 确认连接。然后,我们可以远程...

    Hadoop分布式集群IP配置和VBox linux虚拟机网卡配置

    Hadoop分布式集群搭建过程中IP配置,包括单机伪分布式和多台机器集群搭建。同时包括VBox linux虚拟机网卡配置

    大数据之hadoop分布式集群初次启动.pdf

    Hadoop 分布式集群初次启动 Hadoop 分布式集群初次启动是大数据处理的重要步骤,涉及到 Hadoop 集群的搭建、ssh 免密登录、HDFS 格式化、Hadoop 集群启动等多个知识点。本文将详细介绍 Hadoop 分布式集群初次启动的...

    Hadoop分布式配置文件hdfs-site.xml

    Hadoop分布式配置文件hdfs-site.xml,用于在搭建Hadoop分布式集群时,设置集群规划所用,集群中虚拟机都需要修改该配置文件,除此之外,还需要修改其他配置文件,包括core-site.xml、mapred-site.xml和yarn-site.xml...

    Hadoop分布式配置文件mapred-site.xml

    Hadoop分布式配置文件mapred-site.xml,用于在搭建Hadoop分布式集群时,设置集群规划所用,集群中虚拟机都需要修改该配置文件,除此之外,还需要修改其他配置文件,包括core-site.xml、hdfs-site.xml和yarn-site.xml...

    基于Hadoop分布式集群搭建方法研究.pdf

    基于Hadoop分布式集群搭建方法研究的知识点包含以下几个方面: 1. Hadoop简介与大数据分布式基础架构: Hadoop是一个开源的大数据平台,由Apache软件基金会支持。它包括HDFS(Hadoop分布式文件系统)和MapReduce...

    部署全分布模式Hadoop集群 实验报告

    部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。...5. 配置全分布模式 Hadoop 集群。 6. 关闭防火墙。 7. 格式化文件系统。 8. 启动和验证 Hadoop。 9. 关闭 Hadoop。

    Hadoop-0.21.0分布式集群配置

    Hadoop-0.21.0分布式集群配置.doc

    大数据之hadoop分布式集群参数配置.pdf

    【大数据之Hadoop分布式集群参数配置】...总结来说,配置Hadoop分布式集群涉及多个步骤,包括但不限于网络配置、Hadoop配置文件的修改以及节点间的通信设置。正确地完成这些步骤,能确保Hadoop集群的稳定性和高效运行。

    大数据之hadoop分布式集群初次启动 (2).docx

    大数据之Hadoop分布式集群初次启动 在当前信息技术迅猛发展的背景下,大数据技术成为推动社会进步的重要力量。其中,Hadoop作为大数据领域最为流行的开源框架之一,它通过提供分布式存储与计算解决方案,有效地处理...

    hadoop 分布式集群大数据云计算源码视频教程.zip

    《Hadoop分布式集群大数据云计算源码视频教程》是一套深入解析Hadoop技术栈及大数据云计算实践的综合学习资源。该教程旨在帮助学习者理解和掌握Hadoop在分布式集群环境中的核心概念、工作原理以及实际应用,从而提升...

    Hadoop分布式集群搭建所需安装包资源

    总结一下,本资源包提供了搭建Hadoop分布式集群所需的两个基础组件:JDK 8和Hadoop 2.7.5。在实际操作中,你需要在每个节点上安装JDK,配置Hadoop环境,调整相关配置文件以适应你的集群需求,最后启动服务,确保集群...

    构建Hadoop分布式集群环境

    构建Hadoop分布式集群环境是一项涉及多个知识点的复杂任务,它要求系统管理员或大数据工程师具备对Hadoop架构、云计算平台和Linux操作系统深入的理解和实践经验。下面将详细介绍在构建Hadoop分布式集群时所需的知识...

    Hadoop分布式集群搭建.pdf

    总结来说,搭建Hadoop分布式集群涉及多方面的工作,包括系统环境的设定、网络配置、SSH无密码登录、配置文件的修改以及集群的启动和监控。这个过程需要对Linux系统和Hadoop框架有深入的理解,但一旦完成,就能构建出...

Global site tag (gtag.js) - Google Analytics