`

hadoop伪集群配置

 
阅读更多

1. 将hadoop与主机连接方式设置成host-only,并设置静态地址

 http://oracle-api.iteye.com/admin/blogs/2304613

 

2. 修改主机名

     vi  /etc/sysconfig/network

   验证:重启 reboot

 

3. 修改hostname和IP绑定

     vi /etc/hosts  

     增加一行内容:   192.168.56.2   hadoop

    验证:ping hadoop

 

4. 关闭防火墙

    service iptable  stop

    验证: service iptable status

 

5 关闭防火墙的自动运行

    chkconfig  iptables off

    验证: chkconfig --list | grep ipconfig

    修改前: 0:off 1:off 2:on 3:on 4:on 5:on 6:off

    修改后: 0:off 1:off 2:off 3:off 4:off 5:off 6:off

 

6 SSH的免密码登录

6.1 执行命令

      ssh-keygen -t rsa   回车  回车  回车,

      生成的密码位于~/.ssh/ (root账户位于/root/.ssh/)

      验证: ~/.ssh/ 下产生两个文件 id_rsa  和 id_rsa.pub

6.1 复制公钥文件(作为一个请求登录的机器,被请求机器的公钥是位于请求机器的~/.ssh/authorized_keys文件中)

      ~/.ssh/下执行命令: cp id_rsa.pub  authorized_keys

      验证: 执行命令 ssh localhost   (用ssh方式登录到localhost),退出登录命令: exit

 

7.1 下载hadoop-2.6.4.tar.gz 和 jdk-6u45-linux-i586.bin

http://www.oracle.com/technetwork/java/javase/downloads/index.html

http://mirrors.cnnic.cn/apache/hadoop/core/

7.2 删除/usr/local/下文件  rm -rf  /usr/local/*

7.3 复制安装文件  cp /root/downloads/* /usr/local/

7.4 赋予执行权限

      chmod u+x jdk-6u45-linux-i586.bin

      chmod u+x hadoop-2.6.4.tar.gz

 

8 安装jdk

8.1 执行命令 ./jdk-6u45-linux-i586.bin 解压文件

8.2  设置path,命令 vi /etc/profile , 添加下面两行:

       export JAVA_HOME=/usr/local/jdk1.6.0_45

       export PATH=.:$JAVA_HOME/bin:$PATH

       保存执行命令: source /etc/profile 使之生效

验证: java -version

 

9 安装hadoop

9.1 解压  tar -zxvf hadoop-1.2.1.tar.gz

9.2 设置path,命令 vi /etc/profile , 添加下面两行:

       export HADOOP_HOME=/usr/local/hadoop-1.2.1

       export PATH=.:$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

       保存执行命令: source /etc/profile 使之生效

 9.2 修改$HADOOP_HOME/conf/hadoop-env.sh

       export JAVA_HOME=/usr/local/jdk1.6.0_45

 9.3  修改$HADOOP_HOME/conf/core-site.xml       

<configuration>
	<property>
		<name>fs.default.name</name>
		<value>hdfs://hadoop:9000</value>
		<description>change your own name</description>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/usr/local/hadoop-1.2.1/tmp</value>
	</property>
</configuration>

 9.4 修改hdfs.site.xml

<configuration>
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
</configuration>

 9.5 修改mapred-site.xml

<configuration>
	<property>
		<name>mapred.job.tracker</name>
		<value>hadoop:9001</value>
		<description>change your own hostname</description>
	</property>
</configuration>

 9.6 格式化hdfs

    执行命令:hadoop  namenode -format

 

10 启动hadoop  

     执行命令:start-all.sh

     验证: jps 出现5个进程

     或打开网页: http://192.168.56.2:50070/  和  http://192.168.56.2:50030/

 

11 重新格式化hdfs的方法

    删除/usr/local/hadoop-1.2.1/tmp  后重新格式化

分享到:
评论

相关推荐

    hadoop伪集群搭建及eclipse插件配置

    本文将详细介绍如何搭建Hadoop伪集群环境,并在Eclipse中配置插件。 首先,搭建Hadoop伪集群环境主要分为以下几个步骤: 1. 安装Hadoop环境:需要在机器上安装Java环境,因为Hadoop是用Java编写的。除此之外,还...

    linux虚拟机搭建hadoop伪分布式集群

    在搭建Hadoop伪分布式集群的过程中,首先需要在Linux环境下配置VMware的NAT网络,确保虚拟机能够稳定地运行和通信。NAT网络允许虚拟机通过宿主机与外部网络进行通信,同时保持IP地址的固定性。具体操作包括取消DHCP...

    云计算hadoop伪集群+hbase安装配置手册(伪集群)

    ### 云计算Hadoop伪集群与HBase安装配置详解 #### 1. 综述 本文档旨在为IT工程师提供在单台Linux服务器上构建和配置Hadoop伪集群及HBase服务的详细指南。Hadoop是一种分布式计算框架,主要用于处理大量数据集。而...

    hadoop伪分布配置

    这种方式既能够体验到Hadoop的分布式特性,又不需要复杂的多节点集群配置。本文将详细介绍如何在Ubuntu系统上搭建Hadoop伪分布环境。 #### 二、准备工作 在开始之前,请确保已经具备以下条件: 1. **操作系统**:...

    Linux下Hadoop伪分布式配置及操作命令

    以上知识点详细地阐述了在CentOS系统上配置Hadoop伪分布式环境的全过程,包括了环境准备、JDK安装、环境变量配置、Hadoop配置文件修改、SSH无密码登录配置、集群的启动和使用,以及常用命令的介绍。对于初学者来说,...

    Linux下Hadoop伪分布式配置.pdf

    Linux 下 Hadoop 伪分布式配置需要进行多个步骤,包括 JDK 安装、SSH 无密码验证配置、Hadoop 配置、Hadoop 集群启动和 Hadoop 使用等。在伪分布式模式下,Hadoop 可以模拟分布式环境,用于测试和开发 Hadoop 应用...

    hadoop伪分布式安装.pdf

    在开始配置Hadoop伪分布式之前,需要确保已经完成了基本的环境搭建工作。主要包括: 1. **系统环境准备**:一般情况下,推荐使用Linux操作系统,因为它提供了良好的稳定性和性能。 2. **JDK安装**:Hadoop基于Java...

    shell脚本配置Hadoop伪分布式.zip

    在这个"shell脚本配置Hadoop伪分布式.zip"压缩包中,包含了配置Hadoop伪分布式环境所需的所有资源和指南。伪分布式模式是在单个节点上模拟分布式环境,这对于学习和测试Hadoop功能非常有用,无需复杂的多节点集群...

    Hadoop伪分布式集群环境搭建

    以上就是Hadoop伪分布式集群环境的搭建过程。通过这个环境,你可以深入了解Hadoop的工作原理,进行各种数据处理实验,为后续的大数据项目打下坚实的基础。在实际生产环境中,为了实现更高的可用性和容错性,通常会...

    hadoop伪分布式集群搭建

    本指南将详细介绍如何在Linux环境下搭建Hadoop伪分布式集群,并提供详细的步骤和配置信息。 **环境配置要求:** - **操作系统:** Linux - **硬件资源:** 至少4GB内存 - **网络配置:** - 使用NAT模式或桥接模式...

    CentOS搭建hadoop伪分布式时遇到的错误.doc

    在Hadoop伪分布式环境中,通常只需要一个节点来模拟分布式集群的行为。因此,所有Hadoop组件都将在本地机器上运行,这包括NameNode、DataNode、ResourceManager、NodeManager等。配置Hadoop时,确保`hadoop-env.sh`...

    hadoop 伪分布式环境配置

    完全分布式模式是指 Hadoop 集群的配置方式。在完全分布式模式下,一台机器作为 master,上面运行 namenode 和 jobtracker,另外的机器作为 slave,上面运行 datanode 和 tasktracker。secondaryname 是 namenode 的...

    hadoop的独立模式、伪分布模式、完全分布式、HA配置文件

    在Hadoop生态系统中,了解和配置不同的运行模式是至关重要的,这些模式包括独立模式、伪分布模式、完全分布式模式以及高可用性(HA)配置。接下来,我们将详细探讨这些模式及其相关的配置文件。 1. **独立模式**: ...

    Hadoop分布式集群IP配置和VBox linux虚拟机网卡配置

    Hadoop分布式集群搭建过程中IP配置,包括单机伪分布式和多台机器集群搭建。同时包括VBox linux虚拟机网卡配置

    hadoop+hbase+zookeeper集群配置流程及文件

    提供的文档`hadoop_zookeeper_hbase集群配置.docx`应包含详细的步骤和配置示例,而`配置文件.rar`则可能包含了预设的配置模板,可以作为配置参考。在实际操作时,务必根据具体环境调整配置,确保所有节点之间的网络...

    伪分布式hadoop的配置信息

    ### 伪分布式Hadoop的配置信息 在深入探讨伪分布式Hadoop配置之前,我们先来了解下何为伪分布式模式。伪分布式模式是指Hadoop集群的所有守护进程运行在同一台机器上,但它们仍然通过网络(通常是在不同的端口上)...

    hadoop伪分布式搭建.doc

    本篇文章将详细解析Hadoop伪分布式集群环境的搭建步骤,以及在搭建过程中可能遇到的问题及其解决方案。 首先,我们需要在虚拟机中准备好Hadoop的安装包。这里以Hadoop 2.5.0-cdh5.3.6为例,将其解压至/usr/iflytek...

    大数据之hadoop分布式集群参数配置.docx

    按下图步骤删除原来伪分布集群配置的DataNode相关配置,并将数据冗余数量设置为2。最后,退出编辑模式,保存并退出。 2. core-site.xml配置 core-site.xml是Hadoop核心配置文件。在master节点上,我们需要指定一个...

Global site tag (gtag.js) - Google Analytics