hadoop是什么就不多说了,看这里
hadoop推荐部署环境是在linux,但是我们想要在windows体验一下还是可以的,follow me
我的环境:windows xp,hadoop安装包(0.20.2) ,cygwin
打开cygwin
把hadoop的包放到这个目录下
然后输入命令
tar zxf hadoop-0.20.1.tar.gz
解压完成后进入hadoop-0.20.1的配置目录,打开core-site.xml,加入以下内容。这里是定义namenode运行地址和端口
<property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property>
打开hdfs-site.xml,加入以下内容
<property> <name>dfs.replication</name> <value>1</value> </property>
这里把复制因子设置为1是因为我们在windows上做伪分布,只能启动一个datanode
打开mapred-site.xml,加入以下内容
<property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property>
接下来可以定义namenode数据目录,和datanode数据目录。当然这个不是必须的,默认是在/tmp目录下面
<property> <name>dfs.name.dir</name> <value>c:/filesystem/name</value> </property> <property> <name>dfs.data.dir</name> <value>c:/filesystem/data</value> </property>
最后修改hadoop-env.sh,把下面注释的这行打开,并设置为你的jdk路径。如果你的java在Program Files下,则整个jdk路径加引号
export JAVA_HOME=你的jdk路径 例如 export JAVA_HOME=/cygdrive/c/Progra~1/Java/jdk1.6
ok,在cygwin下,先修改编码
export "LANG=en.UTF-8"
进入bin目录,首先需要格式化namenode
./hadoop namenode -format
然后启动namenode
./hadoop namenode
再打开一个datanode,同样在bin目录下
./hadoop datanode
不出意外,你会看到
namenode
datanode
我们可以试一下上传文件
./hadoop fs -put d:/download/vmware6.03.rar /tt/vm.rar
list一下
./hadoop fs -lsr /tt
结果:
-rw-r--r-- 1 Administrator supergroup 20793970 2010-01-18 15:52 /tt/vm.rar
有兴趣的筒子可以去c:/filesystem/data/current看看哈:)
过几天再记录一下hadoop mapreduce
相关推荐
Windows安装hadoop Windows安装hadoop Windows安装hadoop Windows安装hadoop Windows安装hadoop Windows安装hadoop
以下是一些关于在Windows上安装Hadoop库文件的关键知识点: 1. **Java开发工具**:Hadoop依赖于Java环境,因此首先需要安装Java Development Kit (JDK)。确保下载与Windows操作系统兼容的JDK版本,并正确配置`JAVA_...
3. **配置hadoop-env.cmd**:在解压目录的conf子目录下找到hadoop-env.cmd文件,设置HADOOP_HOME指向Hadoop安装路径,并配置Java路径(JAVA_HOME)。 4. **配置core-site.xml**:在这个文件中,你需要定义Hadoop的...
windows环境下安装hadoop-2.8.3的详细步骤,包括调用自带的CountWord。
在Windows环境下搭建Hadoop环境,一个关键步骤是安装Hadoop的依赖库。Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。在Windows上安装Hadoop时,需要确保系统具备所有必要的组件和配置,以便正确...
Windows 下安装 Hadoop 教程 Hadoop 是一个开源的大数据处理框架,由 Doug Cutting 和 Mike Cafarella 于 2005 年创建,现今已经成为业界标准的分布式计算平台。然而,在 Windows 系统中安装 Hadoop 并不是一件简单...
在Windows环境下搭建Hadoop分布式框架时,一个必不可少的步骤就是安装Hadoop的依赖库——WinUtils。这个库是Hadoop在Windows系统上运行所必需的,因为它提供了与Linux系统中`hadoop`命令类似的功能。本文将详细介绍...
3. **配置Hadoop**:配置文件通常位于"Hadoop安装目录\etc\hadoop"下,包括`core-site.xml`、`hdfs-site.xml`、`mapred-site.xml`和`yarn-site.xml`等。这些文件需要根据你的系统设置进行适当修改,例如设置HDFS的...
在Windows操作系统上安装Hadoop可能是一项挑战,但通过遵循正确的步骤和使用合适的工具,这个过程可以变得相对平滑。本文将详细介绍如何在Windows环境中搭建Hadoop,并在Vista或Win7系统上安装SSH服务,以便远程管理...
### Windows环境下安装与配置Hadoop知识点详解 #### 一、前言 Hadoop是一个开源软件框架,用于分布式存储和处理大型数据集。虽然Hadoop主要为Linux/Unix环境设计,但在某些情况下,用户可能需要在Windows环境下进行...
在Windows操作系统上安装Hadoop可能比在Linux环境下稍微复杂一些,因为Hadoop主要设计为在类Unix系统上运行。然而,通过使用Cygwin——一个提供Linux命令行接口和工具的开源软件,我们可以让Hadoop在Windows上运行。...
在Windows上安装Hadoop是一项复杂但值得学习的任务,它涉及到多个步骤和技术,包括环境配置、依赖工具的安装以及服务的启动和管理。本教程将详细解释这个过程,并着重解决一个常见的问题——Cygwin SSHD服务启动失败...
在Windows上安装Hadoop可能会遇到一些挑战,因为Hadoop最初是为Linux设计的。但是,通过一些特殊配置,如使用Cygwin或Windows Subsystem for Linux(WSL)等工具,可以在Windows环境下运行Hadoop。这里我们将探讨...
总之,配置Hadoop 2.7.7在Windows上是一项涉及多个步骤的任务,包括拷贝bin文件、处理系统级依赖、配置环境变量、修改配置文件、启动服务以及验证安装。理解这些步骤和相关文件的作用对于成功部署和运行Hadoop至关...
### Eclipse安装Hadoop插件详解 #### 一、前言 随着大数据技术的快速发展,Hadoop作为处理海量数据的重要工具之一,其应用越来越广泛。为了更好地利用Eclipse进行Hadoop程序开发,安装Hadoop Eclipse插件是十分...
在Windows环境下搭建Hadoop 3.1.0的分布式文件系统需要解决一个重要依赖——WinUtils。这个组件是Hadoop在Windows上运行所必需的,因为Hadoop原本是为Linux环境设计的,它的一些核心功能,如文件操作和本地进程管理...