`
zqhxuyuan
  • 浏览: 32261 次
  • 性别: Icon_minigender_1
  • 来自: 福建
社区版块
存档分类
最新评论

Meet Hadoop on Windows

阅读更多

 

hadoop-0.20.2 单机模式和伪分布式部署

 

1. install cygwin sshd

2. 下载hadoop-0.20.2,解压到d:/hadoop-0.20.2

3. hadoop-evn.sh添加以下配置:

export JAVA_HOME=C:/jdk1.6

 

4. 单机模式

 

下面的实例将已解压的 conf 目录拷贝作为输入,

查找并显示匹配给定正则表达式的条目。输出写入到指定的 output 目录。

 

$ ssh localhost

$ export "LANG=en.UTF-8"

$ cd d:/hadoop-0.20.2

$ mkdir input 

$ cp conf/*.xml input 

$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

$ cat output/*

 

5. 伪分布式:

 

配置文件conf/

core-site.xml:  

从src/core/core-default.xml拷贝文件到conf下改名为core-site.xml.并更改以下配置

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

hdfs-site.xml:

从src/hdfs/hdfs-default.xml拷贝并改名.其他配置不需要改变.

 

mapred-site.xml:

从src/mapred/mapred-default.xml拷贝并改名.并更改以下配置

<property>

<name>mapred.job.tracker</name>

<value>localhost:9999</value>

</property>

 

$ ssh localhost

$ export "LANG=en.UTF-8"

$ cd d:/hadoop-0.20.2

 

#格式化一个新的分布式文件系统

$ bin/hadoop namenode -format       #Y(不能是y)

 

#启动 Hadoop 守护进程

$ bin/start-all.sh

#浏览 NameNode 和 JobTracker 的网络接口

NameNode - http://localhost:50070/

JobTracker - http://localhost:50030/

 

#查看进程

$ jps

4600 JobTracker

828 Jps

4772 NameNode

 

#将输入文件拷贝到分布式文件系统

$ bin/hadoop fs -put conf input

 

#运行发行版提供的示例程序

$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

 

#查看输出文件1.将输出文件从分布式文件系统拷贝到本地文件系统查看

$ bin/hadoop fs -get output output 

$ cat output/*

 

#2.在分布式文件系统上查看

$ bin/hadoop fs -cat output/*

 

#完成全部操作后,停止守护进程

$ bin/stop-all.sh

stopping jobtracker localhost: stopping tasktracker stopping namenode localhost: stopping datanode localhost: stopping secondarynamenode $ exit logout $ exit PS: hadoop启动的时候,即start-all.sh这一步: netstat -a 会看到有两个127.0.0.1:9000和两个127.0.0.1:9999 查看任务管理器,会看到多个java进程.

 

 

参考资料:

1. Hadoop 开发者入门期刊

 

2. Hadoop---在window下配置安装之cygwin的安装

http://hi.baidu.com/%BD%AB%D6%AE%B7%E7_%BE%B2%D6%AE%D4%A8/blog/item/8832551c7598551f314e15c2.html

 

3. Hadoop---在window下的安装配置----基于cygwin的

http://hi.baidu.com/%BD%AB%D6%AE%B7%E7_%BE%B2%D6%AE%D4%A8/blog/item/a0ebb1db953a772033fa1c9a.html

 

4. 在 Windows 平台下部署 Hadoop 开发环境

http://blog.csdn.net/savechina/article/details/5656937


分享到:
评论

相关推荐

    hadooponwindows-master

    请将hadoop2.7.1中的bin和etc删除,使用hadooponwindows-master中的bin和etc代替 资源说明: 有些时候,我们想在自己电脑windows系统上使用hadoop,这样省去了建虚拟机的麻烦——虚拟机会占用更多电脑系统资源。 ...

    hadooponwindows-master.rar

    标题 "hadooponwindows-master.rar" 暗示这是一个关于在Windows系统上搭建Hadoop环境的项目或教程的压缩文件。Hadoop是一个开源框架,主要用于处理和存储大规模数据,最初设计时主要考虑的是运行在Linux集群上,但...

    hadooponwindows.zip

    标签"hadooponwindows2"可能暗示这是一个关于在Windows上安装Hadoop的更新版本或更深入的教程,可能涉及到新的特性、改进的兼容性或特定的优化技巧。 综上所述,"Hadoop on Windows"涵盖了从安装Java环境、配置...

    hadooponwindows

    hadoop运行在windows上,基于hadoop2.7.1上,解压后替换原有的bin、etc目录,其它与linux 操作一致。

    hadoop-windows下配置文件

    在Windows环境下配置Hadoop是一项技术性的工作,但通过提供的压缩包文件,您可以简化这个过程,避免手动编译的复杂步骤。以下是对标题和描述中涉及的知识点的详细说明: 1. **Hadoop**: Hadoop是一个开源框架,由...

    Hadoop在Windows的依赖资源

    标题 "Hadoop在Windows的依赖资源" 涉及到的是在Windows环境下配置和运行Hadoop时遇到的问题,特别是关于`winutils.exe`这个关键组件的缺失或定位错误。Hadoop通常是在Linux环境下运行,但在Windows上进行开发和测试...

    Hadoop 2.7.4Windows 64位 编译bin

    Hadoop最初设计时主要考虑的是Linux环境,但随着Windows平台上的需求增加,Hadoop也提供了在Windows上的支持。Hadoop在Windows上的运行涉及到一些与Unix/Linux系统不同的步骤,尤其是在处理原生库(native libraries...

    hadoop的windows压缩包

    2. **HadooponWindows-master.rar**: 这个文件可能是专门为在Windows系统上安装和配置Hadoop的指南或工具包。"master"可能表示这是一个主版本或者包含了全部步骤和必要组件的集合。RAR是一种流行的压缩格式,同样...

    Hadoop 2.7.5 Windows 7 64位 编译bin(包含winutils.exe, hadoop.dll等)

    总的来说,Hadoop 2.7.5在Windows 7 64位环境下的编译是一个技术性的挑战,但这个资源简化了这一过程,使得开发者能够更轻松地在Windows平台上使用Hadoop。`winutils.exe`和`hadoop.dll`作为关键组件,确保了Hadoop...

    windows环境下的hadoop3.1.0依赖,winutils

    在Windows环境下搭建Hadoop 3.1.0的分布式文件系统需要解决一个重要依赖——WinUtils。这个组件是Hadoop在Windows上运行所必需的,因为Hadoop原本是为Linux环境设计的,它的一些核心功能,如文件操作和本地进程管理...

    hadoop_windows_tools.rar

    标题中的"hadoop_windows_tools.rar"暗示了这是一组专为Windows用户定制的Hadoop工具,其中可能包括了使Hadoop在Windows上运行所必需的一些组件和配置。描述提到该插件适用于Hadoop2.7.6版本,这意味着这些工具与...

    Hadoop 2.7.4 Windows 64位 编译bin

    2. **Hadoop on Windows**:在Windows环境下安装Hadoop通常比在Linux上复杂,因为Hadoop最初是为Linux设计的。不过,通过使用预编译的bin包,用户可以直接在Windows上运行Hadoop的命令行工具,无需编译源代码。 3. ...

    hadoop2.8.1 Windows安装依赖文件

    本压缩包文件"**hadoop2.8.1 Windows安装依赖文件**"是针对Hadoop 2.8.1版本在Windows操作系统上的搭建所需的重要组件,特别适用于Windows 7和Windows Server 2008及更高版本的64位系统。 Hadoop的核心组成部分包括...

    hadoop_on_windows_2.6.0

    包括:hadoop-eclipse-plugin-2.6.0.jar,hadoop-2.6.0.tar.gz,hadoop-common-2.6.0-bin-master,支持Eclipse在windows上进行hadoop开发,实测可用。

    Hadoop 2.7.4 Windows 7 64位 编译bin(包含winutils.exe, hadoop.dll等)

    标题中的“Hadoop 2.7.4 Windows 7 64位 编译bin(包含winutils.exe, hadoop.dll等)”指的是一个专为Windows 7 64位操作系统编译的Hadoop二进制包,包含了关键组件winutils.exe和hadoop.dll。这些文件对于在Windows...

    masonsxu(hadoop&windows).zip

    此资源还是hadooponwindows-master,原地址为https://github.com/sardetushar/hadooponwindows/,为了方便上传,我把它换了一个名字,无意修改。 方便观看博客的人能够使用,请谅解。

    HADOOP2.8.1Windows环境下压缩包

    总结来说,这个"HADOOP2.8.1Windows环境下压缩包"为Windows用户提供了一个便捷的途径来安装和使用Hadoop,而无需复杂的编译过程。只需正确配置和管理,你就可以在本地环境中进行大数据处理和分析,这对于学习Hadoop...

Global site tag (gtag.js) - Google Analytics