1. 将hadoop与主机连接方式设置成host-only,并设置静态地址
http://oracle-api.iteye.com/admin/blogs/2304613
2. 修改主机名
vi /etc/sysconfig/network
验证:重启 reboot
3. 修改hostname和IP绑定
vi /etc/hosts
增加一行内容: 192.168.56.2 hadoop
验证:ping hadoop
4. 关闭防火墙
service iptable stop
验证: service iptable status
5 关闭防火墙的自动运行
chkconfig iptables off
验证: chkconfig --list | grep ipconfig
修改前: 0:off 1:off 2:on 3:on 4:on 5:on 6:off
修改后: 0:off 1:off 2:off 3:off 4:off 5:off 6:off
6 SSH的免密码登录
6.1 执行命令
ssh-keygen -t rsa 回车 回车 回车,
生成的密码位于~/.ssh/ (root账户位于/root/.ssh/)
验证: ~/.ssh/ 下产生两个文件 id_rsa 和 id_rsa.pub
6.1 复制公钥文件(作为一个请求登录的机器,被请求机器的公钥是位于请求机器的~/.ssh/authorized_keys文件中)
~/.ssh/下执行命令: cp id_rsa.pub authorized_keys
验证: 执行命令 ssh localhost (用ssh方式登录到localhost),退出登录命令: exit
7.1 下载hadoop-2.6.4.tar.gz 和 jdk-6u45-linux-i586.bin
http://www.oracle.com/technetwork/java/javase/downloads/index.html
http://mirrors.cnnic.cn/apache/hadoop/core/
7.2 删除/usr/local/下文件 rm -rf /usr/local/*
7.3 复制安装文件 cp /root/downloads/* /usr/local/
7.4 赋予执行权限
chmod u+x jdk-6u45-linux-i586.bin
chmod u+x hadoop-2.6.4.tar.gz
8 安装jdk
8.1 执行命令 ./jdk-6u45-linux-i586.bin 解压文件
8.2 设置path,命令 vi /etc/profile , 添加下面两行:
export JAVA_HOME=/usr/local/jdk1.6.0_45
export PATH=.:$JAVA_HOME/bin:$PATH
保存执行命令: source /etc/profile 使之生效
验证: java -version
9 安装hadoop
9.1 解压 tar -zxvf hadoop-1.2.1.tar.gz
9.2 设置path,命令 vi /etc/profile , 添加下面两行:
export HADOOP_HOME=/usr/local/hadoop-1.2.1
export PATH=.:$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
保存执行命令: source /etc/profile 使之生效
9.2 修改$HADOOP_HOME/conf/hadoop-env.sh
export JAVA_HOME=/usr/local/jdk1.6.0_45
9.3 修改$HADOOP_HOME/conf/core-site.xml
<configuration> <property> <name>fs.default.name</name> <value>hdfs://hadoop:9000</value> <description>change your own name</description> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop-1.2.1/tmp</value> </property> </configuration>
9.4 修改hdfs.site.xml
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.permissions</name> <value>false</value> </property> </configuration>
9.5 修改mapred-site.xml
<configuration> <property> <name>mapred.job.tracker</name> <value>hadoop:9001</value> <description>change your own hostname</description> </property> </configuration>
9.6 格式化hdfs
执行命令:hadoop namenode -format
10 启动hadoop
执行命令:start-all.sh
验证: jps 出现5个进程
或打开网页: http://192.168.56.2:50070/ 和 http://192.168.56.2:50030/
11 重新格式化hdfs的方法
删除/usr/local/hadoop-1.2.1/tmp 后重新格式化
相关推荐
本文将详细介绍如何搭建Hadoop伪集群环境,并在Eclipse中配置插件。 首先,搭建Hadoop伪集群环境主要分为以下几个步骤: 1. 安装Hadoop环境:需要在机器上安装Java环境,因为Hadoop是用Java编写的。除此之外,还...
在搭建Hadoop伪分布式集群的过程中,首先需要在Linux环境下配置VMware的NAT网络,确保虚拟机能够稳定地运行和通信。NAT网络允许虚拟机通过宿主机与外部网络进行通信,同时保持IP地址的固定性。具体操作包括取消DHCP...
### 云计算Hadoop伪集群与HBase安装配置详解 #### 1. 综述 本文档旨在为IT工程师提供在单台Linux服务器上构建和配置Hadoop伪集群及HBase服务的详细指南。Hadoop是一种分布式计算框架,主要用于处理大量数据集。而...
这种方式既能够体验到Hadoop的分布式特性,又不需要复杂的多节点集群配置。本文将详细介绍如何在Ubuntu系统上搭建Hadoop伪分布环境。 #### 二、准备工作 在开始之前,请确保已经具备以下条件: 1. **操作系统**:...
以上知识点详细地阐述了在CentOS系统上配置Hadoop伪分布式环境的全过程,包括了环境准备、JDK安装、环境变量配置、Hadoop配置文件修改、SSH无密码登录配置、集群的启动和使用,以及常用命令的介绍。对于初学者来说,...
Linux 下 Hadoop 伪分布式配置需要进行多个步骤,包括 JDK 安装、SSH 无密码验证配置、Hadoop 配置、Hadoop 集群启动和 Hadoop 使用等。在伪分布式模式下,Hadoop 可以模拟分布式环境,用于测试和开发 Hadoop 应用...
在开始配置Hadoop伪分布式之前,需要确保已经完成了基本的环境搭建工作。主要包括: 1. **系统环境准备**:一般情况下,推荐使用Linux操作系统,因为它提供了良好的稳定性和性能。 2. **JDK安装**:Hadoop基于Java...
在这个"shell脚本配置Hadoop伪分布式.zip"压缩包中,包含了配置Hadoop伪分布式环境所需的所有资源和指南。伪分布式模式是在单个节点上模拟分布式环境,这对于学习和测试Hadoop功能非常有用,无需复杂的多节点集群...
以上就是Hadoop伪分布式集群环境的搭建过程。通过这个环境,你可以深入了解Hadoop的工作原理,进行各种数据处理实验,为后续的大数据项目打下坚实的基础。在实际生产环境中,为了实现更高的可用性和容错性,通常会...
本指南将详细介绍如何在Linux环境下搭建Hadoop伪分布式集群,并提供详细的步骤和配置信息。 **环境配置要求:** - **操作系统:** Linux - **硬件资源:** 至少4GB内存 - **网络配置:** - 使用NAT模式或桥接模式...
在Hadoop伪分布式环境中,通常只需要一个节点来模拟分布式集群的行为。因此,所有Hadoop组件都将在本地机器上运行,这包括NameNode、DataNode、ResourceManager、NodeManager等。配置Hadoop时,确保`hadoop-env.sh`...
完全分布式模式是指 Hadoop 集群的配置方式。在完全分布式模式下,一台机器作为 master,上面运行 namenode 和 jobtracker,另外的机器作为 slave,上面运行 datanode 和 tasktracker。secondaryname 是 namenode 的...
在Hadoop生态系统中,了解和配置不同的运行模式是至关重要的,这些模式包括独立模式、伪分布模式、完全分布式模式以及高可用性(HA)配置。接下来,我们将详细探讨这些模式及其相关的配置文件。 1. **独立模式**: ...
Hadoop分布式集群搭建过程中IP配置,包括单机伪分布式和多台机器集群搭建。同时包括VBox linux虚拟机网卡配置
提供的文档`hadoop_zookeeper_hbase集群配置.docx`应包含详细的步骤和配置示例,而`配置文件.rar`则可能包含了预设的配置模板,可以作为配置参考。在实际操作时,务必根据具体环境调整配置,确保所有节点之间的网络...
### 伪分布式Hadoop的配置信息 在深入探讨伪分布式Hadoop配置之前,我们先来了解下何为伪分布式模式。伪分布式模式是指Hadoop集群的所有守护进程运行在同一台机器上,但它们仍然通过网络(通常是在不同的端口上)...
本篇文章将详细解析Hadoop伪分布式集群环境的搭建步骤,以及在搭建过程中可能遇到的问题及其解决方案。 首先,我们需要在虚拟机中准备好Hadoop的安装包。这里以Hadoop 2.5.0-cdh5.3.6为例,将其解压至/usr/iflytek...
按下图步骤删除原来伪分布集群配置的DataNode相关配置,并将数据冗余数量设置为2。最后,退出编辑模式,保存并退出。 2. core-site.xml配置 core-site.xml是Hadoop核心配置文件。在master节点上,我们需要指定一个...