`
zpball
  • 浏览: 916992 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Windows下Hadoop的搭建

阅读更多
1.安装JDK
MapReduce 程序的编写和Hadoop 的编译都依赖于JDK,光JRE 是不够的。由于安装JDK对于学习Hadoop的人来说肯定不是问题,这里就不再赘述安装过程了。

2.安装Cygwin
Cygwin 是一个windows下的linux环境模拟工具,我们下载的Cygwin Setup.exe是一个在线安装程序,下载下来Setup.exe之后根据提示一步步安装,建议选择先下载然后安装,这是因为下载有时需要很长的过程,如果边下载边安装可能会出现问题。在安装Cygwin过程中其他选项默认安装,其中Base分支下要选择安装sed, Editors分支下要选择了vim,Net分支下要选择了OpenSSH,所谓选择安装上诉项目就是点击对应项目出现其版本号即可。安装sed是为了在eclipse 上编译Hadoop,安装vim,以方便在Cygwin 上直接修改配置。

3.配置Windows系统变量
需要配置的环境变量为:JAVA_HOME=jre的安装目录,Path=JDK的bin目录;Cygwin的bin目录;Cygwin的usr/bin目录。CYGWIN=ntsec tty。

4.安装sshd服务
启动Cygwin,在命令行输入ssh-host-config,出现提示Should privilege separation be used? 时候选择No。当看到Host configuration finished. Have fun! 则表示ssdh服务安装成功。

5.配置sshd服务
首先在服务中启动CYGWIN sshd 服务然后打开Cygwin输入ssh-keygen生成密钥文件,输入ssh -keygen后遇见要输入文字的地方直接按回车,一般是按三次。接下来生成authorized_keys.用cd 命令切目录到~/.ssh下执行 cp id_rsa.pub authorized_keys复制生成即可。此时执行exit退出Cygwin.重新打开Cygwin执行ssh localhost,如果是第一次根据提示输入yes.然后执行who命令,如何能查看到当前登录用户信息则表示ssh登录成功。(这里必须复制生成authorized_keys后关闭然后再打开Cygwin否则可能会出错)。

6.下载并安装Hadoop
将下载的的Hadoop安装包解压到本地目录,并修改conf文件夹下的四个配置文件分别是hadoop-env.sh、core-site.xml、hdfs-site.xml 和mapred-site.xml。

修改hadoop-env.sh
将hadoop-env.sh中的JAVA_HOME修改成自己的JDK安装路径,由于Linux和Windows环境下路径写法不一样,在复制路径后要将“\”改成“/”并且要用Cygwin的驱动,例如JDK安装目录是C:\ Java\jdk1.7.0_03则该配置文件中应该写成JAVA_HOME= /cygdrive/C/Java/jdk1.7.0_03,并将对应的export前面的#号去掉并保存。

修改core-site.xml
为简化core-site.xml 配置将\run\src\core目录下core-default.xml 文件复制\ run\conf 目录下,并将core-default.xml 文件名改成core-site.xml修改fs.default.name 的值,如下所示:
<name>fs.default.name</name>
<value>hdfs://localhost:8888</value>

其中端口号8888根据需要自行设定

修改hdfs-site.xml
为简化hdfs-site.xml 配置,将run\src\hdfs 目录下的hdfs-default.xml 文件复制到run\conf 目录下,将hdfs-default.xml 文件名改成hdfs-site.xml。改mapred.job.tracker的值,默认为3,这里修改为1,这是因为我们安装的是单机版的伪分布式,故不需要3份备份,只要一份即可,如下所示:
<name>dfs.replication</name>
<value>1</value>


修改mapred-site.xml
为简化mapred-site.xml 配置,run\src\mapred下的mapred-default.xml文件复制到run\conf 并将mapred-default.xml文件名改成mapred-site.xml修改mapred.job.tracker的值,如下所示:
<name>mapred.job.tracker</name>
<value>localhost:9999</value>

其中端口号9999根据需要自行设定.
至此Hadoop安装完毕!

7.启动Hadoop
在Cygwin 中,进入hadoop 的bin 目录,运行./start-all.sh 启动hadoop,在启动成功之后,可以执行./hadoop fs -ls /命令,查看hadoop 的根目录,至此Hadoop在Windows平台下安装成功。并可以正式启动。
(详细相关教程[url]http://v-lad.org/Tutorials/Hadoop/00 - Intro.html[/url])
分享到:
评论

相关推荐

    Windows上Hadoop环境搭建简介

    在Windows上使用Cygwin作为类Unix支撑环境来安装Hadoop, 网上介绍的还是比较多的。 但是我在安装过程中碰到的一些问题, 没有在任何一个可找到的网页中得到全部解决。 例如,我们一开始选择的是Hadoop 1.0.0版本,...

    windows下hadoop2.6开发环境搭建过程说明及插件

    在Windows环境下搭建Hadoop2.6开发环境是一个相对复杂的过程,但通过详细的步骤和注意事项,可以有效地完成。这里我们将深入探讨这个过程,并介绍如何解决可能出现的问题。 首先,我们需要下载Hadoop2.6.0的安装包...

    windows环境下的hadoop3.1.0依赖,winutils

    在Windows环境下搭建Hadoop 3.1.0的分布式文件系统需要解决一个重要依赖——WinUtils。这个组件是Hadoop在Windows上运行所必需的,因为Hadoop原本是为Linux环境设计的,它的一些核心功能,如文件操作和本地进程管理...

    基于windows的hadoop集群搭建图文教程 自己写的亲测可以安装

    然而,对于初学者而言,尤其是在Windows环境下进行Hadoop集群的搭建可能会遇到不少挑战。本文将详细介绍如何在Windows环境下通过虚拟机搭建一个Hadoop集群,包括所需环境配置、具体步骤及注意事项。 #### 二、搭建...

    windows下搭建hadoop开发环境

    在Windows环境下搭建Hadoop开发环境是一项复杂但必要的任务,尤其对于初学者和开发者来说,能够直接在本地系统上运行和调试Hadoop程序是极其有用的。本文将详细介绍如何在Windows上配置Hadoop,以便使用Eclipse进行...

    windows下安装hadoop的依赖库winutils

    在Windows环境下搭建Hadoop分布式框架时,一个必不可少的步骤就是安装Hadoop的依赖库——WinUtils。这个库是Hadoop在Windows系统上运行所必需的,因为它提供了与Linux系统中`hadoop`命令类似的功能。本文将详细介绍...

    windows版hadoop

    Windows版的Hadoop使得在个人计算机上搭建Hadoop环境成为可能,尤其是对于开发者和学习者而言,这提供了一个方便的本地测试环境。 在Windows上安装Hadoop可能会遇到一些挑战,因为Hadoop最初是为Linux设计的。但是...

    windows安装需要的Hadoop库文件

    在Windows环境下搭建Hadoop集群,通常比在Linux系统中更为复杂,因为Hadoop原生是为Linux设计的。然而,通过一些额外的配置和库文件,我们可以在Windows上运行Hadoop。以下是一些关于在Windows上安装Hadoop库文件的...

    windows-hadoop-bin

    这个压缩包提供的就是这些必要的工具,帮助开发者在Windows环境下搭建和测试Hadoop和Spark的环境。 标签 "hadoop" 明确表示这个话题与Hadoop生态系统紧密相关,无论是对于初学者还是有经验的开发人员,理解如何在...

    windows下安装hadoop的依赖库

    在Windows环境下搭建Hadoop环境,一个关键步骤是安装Hadoop的依赖库。Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。在Windows上安装Hadoop时,需要确保系统具备所有必要的组件和配置,以便正确...

    在windows下搭建hadoop2开发环境小案例

    在Windows环境下搭建Hadoop2开发环境是一个常见的任务,尤其对于初学者和开发者来说,了解这一过程至关重要。Hadoop是一个开源的分布式计算框架,它允许在大规模集群上处理和存储大量数据。在这个小案例中,我们将...

    windows下hadoop需要安装所需执行文件

    在Windows环境下搭建Apache Hadoop集群可能会遇到一些挑战,因为Hadoop最初是为Linux设计的。本文将详细讨论如何在Windows上安装和配置Hadoop所需的执行文件,以确保系统能够正常运行。 标题“windows下hadoop需要...

    Hadoop的windows环境搭建依赖jar包

    在Windows环境下搭建Hadoop集群是一项复杂的工作,涉及到多个步骤和依赖项。首先,我们需要了解Hadoop是什么:Hadoop是一个开源的分布式计算框架,基于Java语言实现,主要用于处理和存储大量数据。它允许在廉价硬件...

    windows_hadoop2.7.6

    在Windows环境下搭建Hadoop2.7.6是一个相对复杂的过程,涉及到多个步骤和技术知识点。Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储海量数据。Hadoop2.7.6是该框架的一个稳定版本,...

    windows搭建hadoop详细教程

    用了不到一个星期的时间,通过各种查阅资料终于将hadoop搞定了。 现将学习中遇到的一些问题记录了下来。 分数确实有点高,不过我相信它确实是值得的。 可能会遇到的问题,这里面应该都有所提及。 没有提及的,解决不...

    windows版hadoop插件

    这个“windows版hadoop插件”正是为了解决这个问题,它简化了Windows上的Hadoop开发环境搭建过程。安装该插件后,用户可以直接在IDEA中进行以下操作: 1. **集群连接**:通过插件,用户可以方便地连接到CDH或其他...

    windows下安装hadoop所需要的winutil

    在Windows环境下搭建Hadoop开发和测试环境,通常会遇到一些挑战,因为Hadoop主要设计时是面向Linux操作系统的。然而,通过使用特定的工具和组件,我们可以在Windows上实现Hadoop的功能。标题提到的"windows下安装...

Global site tag (gtag.js) - Google Analytics