hadoop-0.20.2 单机模式和伪分布式部署
1. install cygwin sshd
2. 下载hadoop-0.20.2,解压到d:/hadoop-0.20.2
3. hadoop-evn.sh添加以下配置:
export JAVA_HOME=C:/jdk1.6
4. 单机模式
下面的实例将已解压的 conf 目录拷贝作为输入,
查找并显示匹配给定正则表达式的条目。输出写入到指定的 output 目录。
$ ssh localhost
$ export "LANG=en.UTF-8"
$ cd d:/hadoop-0.20.2
$ mkdir input
$ cp conf/*.xml input
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
$ cat output/*
5. 伪分布式:
配置文件conf/
core-site.xml:
从src/core/core-default.xml拷贝文件到conf下改名为core-site.xml.并更改以下配置
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
hdfs-site.xml:
从src/hdfs/hdfs-default.xml拷贝并改名.其他配置不需要改变.
mapred-site.xml:
从src/mapred/mapred-default.xml拷贝并改名.并更改以下配置
<property>
<name>mapred.job.tracker</name>
<value>localhost:9999</value>
</property>
$ ssh localhost
$ export "LANG=en.UTF-8"
$ cd d:/hadoop-0.20.2
#格式化一个新的分布式文件系统
$ bin/hadoop namenode -format #Y(不能是y)
#启动 Hadoop 守护进程
$ bin/start-all.sh
#浏览 NameNode 和 JobTracker 的网络接口
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/
#查看进程
$ jps
4600 JobTracker
828 Jps
4772 NameNode
#将输入文件拷贝到分布式文件系统
$ bin/hadoop fs -put conf input
#运行发行版提供的示例程序
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
#查看输出文件1.将输出文件从分布式文件系统拷贝到本地文件系统查看
$ bin/hadoop fs -get output output
$ cat output/*
#2.在分布式文件系统上查看
$ bin/hadoop fs -cat output/*
#完成全部操作后,停止守护进程
$ bin/stop-all.sh
stopping jobtracker
localhost: stopping tasktracker
stopping namenode
localhost: stopping datanode
localhost: stopping secondarynamenode
$ exit
logout
$ exit
PS:
hadoop启动的时候,即start-all.sh这一步:
netstat -a 会看到有两个127.0.0.1:9000和两个127.0.0.1:9999
查看任务管理器,会看到多个java进程.
参考资料:
1. Hadoop 开发者入门期刊
2. Hadoop---在window下配置安装之cygwin的安装
http://hi.baidu.com/%BD%AB%D6%AE%B7%E7_%BE%B2%D6%AE%D4%A8/blog/item/8832551c7598551f314e15c2.html
3. Hadoop---在window下的安装配置----基于cygwin的
http://hi.baidu.com/%BD%AB%D6%AE%B7%E7_%BE%B2%D6%AE%D4%A8/blog/item/a0ebb1db953a772033fa1c9a.html
4. 在 Windows 平台下部署 Hadoop 开发环境
http://blog.csdn.net/savechina/article/details/5656937
分享到:
相关推荐
请将hadoop2.7.1中的bin和etc删除,使用hadooponwindows-master中的bin和etc代替 资源说明: 有些时候,我们想在自己电脑windows系统上使用hadoop,这样省去了建虚拟机的麻烦——虚拟机会占用更多电脑系统资源。 ...
标题 "hadooponwindows-master.rar" 暗示这是一个关于在Windows系统上搭建Hadoop环境的项目或教程的压缩文件。Hadoop是一个开源框架,主要用于处理和存储大规模数据,最初设计时主要考虑的是运行在Linux集群上,但...
标签"hadooponwindows2"可能暗示这是一个关于在Windows上安装Hadoop的更新版本或更深入的教程,可能涉及到新的特性、改进的兼容性或特定的优化技巧。 综上所述,"Hadoop on Windows"涵盖了从安装Java环境、配置...
hadoop运行在windows上,基于hadoop2.7.1上,解压后替换原有的bin、etc目录,其它与linux 操作一致。
在Windows环境下配置Hadoop是一项技术性的工作,但通过提供的压缩包文件,您可以简化这个过程,避免手动编译的复杂步骤。以下是对标题和描述中涉及的知识点的详细说明: 1. **Hadoop**: Hadoop是一个开源框架,由...
标题 "Hadoop在Windows的依赖资源" 涉及到的是在Windows环境下配置和运行Hadoop时遇到的问题,特别是关于`winutils.exe`这个关键组件的缺失或定位错误。Hadoop通常是在Linux环境下运行,但在Windows上进行开发和测试...
Hadoop最初设计时主要考虑的是Linux环境,但随着Windows平台上的需求增加,Hadoop也提供了在Windows上的支持。Hadoop在Windows上的运行涉及到一些与Unix/Linux系统不同的步骤,尤其是在处理原生库(native libraries...
2. **HadooponWindows-master.rar**: 这个文件可能是专门为在Windows系统上安装和配置Hadoop的指南或工具包。"master"可能表示这是一个主版本或者包含了全部步骤和必要组件的集合。RAR是一种流行的压缩格式,同样...
总的来说,Hadoop 2.7.5在Windows 7 64位环境下的编译是一个技术性的挑战,但这个资源简化了这一过程,使得开发者能够更轻松地在Windows平台上使用Hadoop。`winutils.exe`和`hadoop.dll`作为关键组件,确保了Hadoop...
在Windows环境下搭建Hadoop 3.1.0的分布式文件系统需要解决一个重要依赖——WinUtils。这个组件是Hadoop在Windows上运行所必需的,因为Hadoop原本是为Linux环境设计的,它的一些核心功能,如文件操作和本地进程管理...
标题中的"hadoop_windows_tools.rar"暗示了这是一组专为Windows用户定制的Hadoop工具,其中可能包括了使Hadoop在Windows上运行所必需的一些组件和配置。描述提到该插件适用于Hadoop2.7.6版本,这意味着这些工具与...
2. **Hadoop on Windows**:在Windows环境下安装Hadoop通常比在Linux上复杂,因为Hadoop最初是为Linux设计的。不过,通过使用预编译的bin包,用户可以直接在Windows上运行Hadoop的命令行工具,无需编译源代码。 3. ...
本压缩包文件"**hadoop2.8.1 Windows安装依赖文件**"是针对Hadoop 2.8.1版本在Windows操作系统上的搭建所需的重要组件,特别适用于Windows 7和Windows Server 2008及更高版本的64位系统。 Hadoop的核心组成部分包括...
包括:hadoop-eclipse-plugin-2.6.0.jar,hadoop-2.6.0.tar.gz,hadoop-common-2.6.0-bin-master,支持Eclipse在windows上进行hadoop开发,实测可用。
标题中的“Hadoop 2.7.4 Windows 7 64位 编译bin(包含winutils.exe, hadoop.dll等)”指的是一个专为Windows 7 64位操作系统编译的Hadoop二进制包,包含了关键组件winutils.exe和hadoop.dll。这些文件对于在Windows...
此资源还是hadooponwindows-master,原地址为https://github.com/sardetushar/hadooponwindows/,为了方便上传,我把它换了一个名字,无意修改。 方便观看博客的人能够使用,请谅解。
总结来说,这个"HADOOP2.8.1Windows环境下压缩包"为Windows用户提供了一个便捷的途径来安装和使用Hadoop,而无需复杂的编译过程。只需正确配置和管理,你就可以在本地环境中进行大数据处理和分析,这对于学习Hadoop...