`
芝加哥09
  • 浏览: 60669 次
社区版块
存档分类
最新评论

一起研究hadoop(一):hadoop的伪分布式安装配置

 
阅读更多

目前hadoop如日中天,只要是涉及到云计算就一定会有hadoop的身影,这是为什么呢?我个人觉得主要是因为hadoop在海量信息的存储和海量信息的分析做得非常出色!目前也有很多人已经在研究hadoop了,为此我觉得我也应该跟随前者的脚步,我也相信你也是!

 

多余的话不说了,进入主题:

第一:

由于安装hadoop是要在linux环境下的,但是我们的操作系统是windows的,为此我们需要先安装好虚拟机。

我这安装的是:VMware Player(到官网下,这是免费的,地址:http://www.vmware.com/cn),同时我安装的linux操作系统是ubuntu(也是免费的,地址:http://www.ubuntu.org.cn)。安装虚拟机的过程,我就不细讲了。

 

第二:

安装好ubuntu操作系统后,建议马上安装ssh。很简单,进入ubuntu的操作终端,输入命令:

sudo apt-get install openssh-server(如果你的linux操作系统不同,该命令有可会不一样

安装好ssh后,你就可以远程访问ubuntu操作系统了,比如你可以下载putty这样的软件来访问,这是由于直接在VMware Player下操作不是很方便,所以一般会通过远程来访问。

 

第三:

配置samba实现文件夹共享

配置samba的目的是你能够很方便的将你windows操作系统上的东西放到虚拟机里面,其实这时只需要ctrl + c,然后ctrl + v。

(1)首先安装samba:

sudo apt-get install samba

 

(2)创建共享目录:

mkdir /home/cloud/share

sodu chmod 777 /home/cloud/share

 

(3)修改配置文件

sudo vim /etc/samba/smb.conf(如果你的ubuntu操作系统中没有vim编辑器,可以通过sudo apt-get install vim 下载安装vim

在smb.conf最后添加如下内容:

[share]
path = /home/cloud/share
available = yes
browseable = yes
public = yes
writable = yes

 

(4)创建samba帐户

sudo touch /etc/samba/smbpasswd
sudo smbpasswd -a cloud

然后会要求你输入samba帐户的密码

 

(5)重启samba服务器

service smbd restart

 

(6)使用

你在windows操作系统中,按windows键+R即打开运行命令,然后你输入:\\ubuntu机器的ip或主机名\share,即可进入共享目录。

 

第四:

由于hadoop是用java编写的,所以我们应该为虚拟机安装jdk。

到官网上下载版本相对较高的linux版本的jdk。

安装好jdk后,就要配置环境变量了,用文本编辑器打开/etc/profile,即sudo vim /etc/profile

然后在最后写入:

export JAVA_HOME=/usr/java/jdk1.6.0_13
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

编辑好后,输入source /etc/profile命令。然后输入java,即看到如图所示就配置成功了:

 

第六:

安装配置hadoop

我使用的hadoop的版本是1.2.1的

(1)首先通过共享目录将hadoop-1.2.1.tar.gz文件复制到虚拟机当中。

 

(2)通过命令:tar zxvf hadoop-1.2.1.tar.gz将该文件解开,会在当前目录下生成一个文件夹名为hadoop-1.2.1。

 

(3)修改conf/Hadoop-env.sh,添加jdk配置

export JAVA_HOME=/usr/java/jdk1.6.0_13

 

(4)修改conf/core-site.xml,在<configuration></configuration>中添加如下内容:

<property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
</property>


(5).修改conf/hdfs-site.xml,在<configuration></configuration>中添加如下内容:

<property>
        <name>dfs.name.dir</name>
        <value>/home/share/hadoop-1.2.1/name</value>
</property>
<property>
        <name>dfs.data.dir</name>
        <value>/home/share/hadoop-1.2.1/data</value>
</property>
<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>注意:此时你应该在hadoop-1.2.1目录下建好name和data两个文件夹,建好文件后,建议分别输入如下命令:

sudo chmod 777 name

sudo chmod 755 data

 

(6)修改conf/mapred-site.xml,在<configuration></configuration>中添加如下内容:

<property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>
</property>

 

(7)修改conf/masters,这个决定那个是secondarynamenode,添加如下内容:

localhost

 

(8)修改conf/slaves,这个是所有datanode的机器,添加如下内容:

localhost

 

(9)为hadoop添加环境变量,即在/etc/profile中添加:

export HADOOP_HOME=/home/share/hadoop-1.2.1

对于PATH,只要将其修改成如下即可:
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

编辑好后,同样要输入source /etc/profile命令。

 

(10)格式化hdfs文件系统的namenode,输入如下命令:

hadoop namenode -format

 

(11)启动Hadoop集群,输入如下命令:

start-all.sh

 

(12)启动完成后,输入jps命令后,可以看到如图所示的java进程,说明hadoop的环境配置成功了!



 

 

 

  • 大小: 23.8 KB
  • 大小: 4.9 KB
分享到:
评论

相关推荐

    Hadoop安装教程_单机_伪分布式配置

    ### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...

    Hadoop2.7.5-HBase1.2.6伪分布式安装

    本文将详细介绍如何在本地环境中进行Hadoop2.7.5与HBase1.2.6的伪分布式安装,这是一个适合初学者入门的实践教程。 Hadoop是Apache基金会的一个开源项目,主要由HDFS(Hadoop Distributed File System)和MapReduce...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...

    Hadoop3.1.3安装和单机/伪分布式配置

    ### Hadoop3.1.3安装与单机/伪分布式配置知识点详解 #### 一、实验目的和要求 - **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 ...

    Hadoop技术-Hadoop伪分布式安装.pptx

    伪分布式安装是Hadoop技术中的一个重要组件,通过设置SSH免密码、安装JDK和Hadoop、配置环境变量、修改配置文件等步骤,可以完成伪分布式安装。这种安装方式可以模拟一个小规模的集群,方便开发人员测试程序的执行。...

    hadoop2.6及hbase0.96伪分布式安装配置文件

    在伪分布式模式下,所有的Hadoop组件都运行在一个单一节点上,这对于测试和学习Hadoop的环境配置非常有用。以下是安装步骤的关键知识点: 1. **环境准备**:确保你的系统满足Java环境的要求,安装JDK,并设置JAVA_...

    hadoop伪分布式安装.pdf

    ### Hadoop伪分布式安装知识点详解 #### 一、Hadoop伪分布式...综上所述,通过以上步骤可以成功配置一个Hadoop伪分布式环境。这种方式对于学习Hadoop的基本概念和技术非常有帮助,同时也适用于小规模的数据处理需求。

    hadoop2.6 centos6.5 伪分布式环境部署 实例

    本文将详细介绍如何在 CentOS 6.5 环境中部署 Hadoop 2.6 伪分布式环境,包括环境准备、Hadoop 安装、配置和测试等步骤。 环境准备 在开始部署 Hadoop 之前,需要准备好 Linux 环境。这里选择 CentOS 6.5 作为操作...

    【IT十八掌徐培成】Hadoop第01天-04.hadoop配置独立模式-伪分布式.zip

    4. 伪分布式模式:伪分布式模式是介于本地模式和完全分布式模式之间的一种配置,同样在一台机器上运行,但每个Hadoop服务都在单独的JVM进程中运行。这种模式可以模拟实际的集群环境,提供更接近真实场景的测试,但又...

    Hadoop安装教程_伪分布式配置_CentOS6.4_Hadoop2.61

    本教程针对的是在CentOS 6.4操作系统上安装Hadoop 2.6.0的伪分布式配置,这种配置方式适合初学者和开发者进行本地测试和学习,它在一个单一节点上模拟分布式环境。 **环境准备** 在开始安装前,确保你的系统是...

    hadoop 2.X 伪分布式配置文件

    2. **伪分布式配置**:在伪分布式环境中,所有Hadoop服务(如NameNode、DataNode、ResourceManager、NodeManager等)都在同一台机器上运行。这可以通过修改`etc/hadoop`目录下的配置文件实现。 3. **配置文件**:...

    hadoop的伪分布式模式配置与安装

    ### Hadoop伪分布式模式配置与安装详解 #### 一、前言 在深入探讨Hadoop伪分布式模式的配置与安装之前,我们先简单回顾一下Hadoop的基本概念以及它为何重要。Hadoop是一个开源框架,用于分布式存储和处理大规模...

    虚拟机中hadoop2.6.0的安装与配置 (单机模式,伪分布式,完全分布式)

    虚拟机Ubuntu下hadoop2.6.0的安装与配置 (单机模式,伪分布式,完全分布式)非常详细的安装配置指南

    云计算应用实验报告 武汉理工大学云计算应用 hadoop单机模式和伪分布式

    单机模式仅在本地启动一个Hadoop进程,而伪分布式模式则模拟多节点集群环境,每个节点在本地运行。 **实验步骤:** 1. **安装Ubuntu 20.04.3**:在虚拟机中安装操作系统,确保系统更新至最新版本。 2. **安装JDK8*...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    2、大数据环境-安装Hadoop2.5.2伪分布式傻瓜教程

    2、大数据环境-安装Hadoop2.5.2伪分布式傻瓜教程 原创

Global site tag (gtag.js) - Google Analytics