部署主要看以下的文档:http://hadoop.apache.org/common/docs/r0.19.2/cn/
开发测试可以使用单机模式部署,以下内容的单机部署和测试参考以下链接:
http://hi.baidu.com/zengjianyuan/blog/item/c86fa10fa3e386e6ab645780.html
就是想了解一下这个东西怎么跑的,为以后工作做准备。
需要软件:
ssh:fedore 9 自带。
jdk:http://java.sun.com/javase/downloads/index.jsp,下最近版本jdk-6u18-linux-i586
hadoop:http://apache.etoak.com/hadoop/core/hadoop-0.20.1/,最新版本0.20.1,据说这个版本jdk必须1.6以上。
三种运行模式:
单机(非分布式)模式,伪分布式运行模式(用不同进程模仿分布式运行中的各类结点),分布式运行模式。
其中前两种运行模式体现不了Hadoop分布式计算的优势,并没有什么实际意义,但对程序的测试及调试很有帮助。现在只有一台机器, 主要想了解基于Hadoop的分布式并行程序是如何运行的。
单机模式安装步骤:
1.解压安装包至:/usr/local/hadoop
如果安装jdk已经设置了路径,安装完毕。否则:
2.cd /usr/local/hadoop/conf,修改hadoop-env.sh,最后一行添加:export JAVA_HOME=/usr/local/jdk1.6.0_18(jdk路径).
看看这玩意怎么跑的:
1.
[root@localhost hadoop]# mkdir input
[root@localhost hadoop]# cp conf/*.xml input
[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar grep input output 'dfs[a-z.]+'
10/01/26 00:22:54 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
10/01/26 00:22:54 INFO mapred.FileInputFormat: Total input paths to process : 5
...
[root@localhost hadoop]# cat output/*
1 dfsadmin
[root@localhost hadoop]# ls output/
part-00000
程序是hadoop自带的,把conf下的xml文件拷贝到input下作为输入,找到并显示所有与最后一个正则表达式匹配的行,输出到output.
jar 是 bin/hadoop 脚本定义的参数,会调用 Hadoop 自己的一个工具类 RunJar,这个工具类能够执行一个 Jar 文件。
2.
[root@localhost hadoop]# mkdir test-in
[root@localhost hadoop]# echo "hello world bye world" > test-in/file1.txt
[root@localhost hadoop]# echo "hello hadoop googbye hadoop" > test-in/file2.txt
[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar wordcount test-in test-out
10/01/26 00:43:46 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
10/01/26 00:43:46 INFO input.FileInputFormat: Total input paths to process : 2
...
[root@localhost hadoop]# cat test-out/*
bye 1
googbye 1
hadoop 2
hello 2
world 2
[root@localhost hadoop]# ls test-out/
part-r-00000
这个程序也是hadoop自带的,统计各个单词出现次数。
刚开始上网搜的结果都是修改fs.default.name,mapred.job.tracker等等,都是分布式运行模式的配置,没想到单机模式这么简单,浪费了不少时间。
参考:
http://blog.csdn.net/inkfish/archive/2010/01/07/5149858.aspx
http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/index.html
分享到:
相关推荐
Hadoop环境安装设置(最简单的hadoop单机环境部署教程) 安装前设置 SSH设置和密钥生成 安装Java.下载Java (JDK<最新版> - X64 ... ...在单机模式下安装Hadoop.... 模拟分布式模式安装Hadoop 验证Hadoop安装
单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。因为不需要...
本文主要介绍了在Ubuntu系统上Hadoop单机版测试环境的搭建过程。
标题 "Hadoop部署及管理内含源码以及说明书可以自己运行复现.zip" 提供了关于这个压缩包的核心内容:它包含的是有关Hadoop部署和管理的资源,其中包括源码和说明书,允许用户自己运行和复现教程中的步骤。...
在Hadoop生态系统中,了解和配置不同的运行模式是至关重要的,这些模式包括独立模式、伪分布模式、完全分布式模式以及高可用性(HA)配置。接下来,我们将详细探讨这些模式及其相关的配置文件。 1. **独立模式**: ...
**Hadoop单机模式与伪分布模式详解** Hadoop是一个开源的分布式计算框架,它允许在廉价硬件上处理大规模数据集。Hadoop提供了多种运行模式,以满足不同环境的需求,其中最常见的两种是单机模式(Local Mode)和伪...
通过本教程的学习,读者可以了解Hadoop单机模式的配置流程,并能够通过一个简单的WordCount程序来验证Hadoop的安装是否成功。需要注意的是,本文档使用的Hadoop版本较为陈旧,对于实际生产环境中Hadoop的配置和使用...
- 部署Hadoop有三种模式:本地单机模式、伪分布式模式和完全分布式模式。本地模式只用于开发和测试,不涉及分布式;伪分布式模式在一个节点上模拟分布式环境;分布式模式则是在多台机器上运行,适合生产环境。 - ...
总的来说,Hadoop单机模式安装是一个基础的实践过程,它有助于理解Hadoop的架构和组件交互,为后续的分布式环境部署打下坚实的基础。在学习和开发过程中,单机模式是一个理想的起点,而实际应用则需考虑更复杂的集群...
### Ubuntu_Hadoop部署笔记 #### 一、Jdk安装与配置 ...通过以上步骤,我们完成了在Ubuntu系统上单机模式下的Hadoop部署。这些配置是Hadoop集群运行的基础,确保每个步骤都准确无误是非常重要的。
### Hadoop环境配置详解——单机集群篇 #### 一、引言 随着大数据时代的到来,Hadoop作为处理海量...希望本文能够帮助您更好地理解和掌握Hadoop的部署流程。未来,您可以基于这个基础进一步探索Hadoop的更多高级特性。
- Pseudo-Distributed Mode:伪分布式模式,单机模拟多节点环境。 - Fully-Distributed Mode:全分布式模式,真正的多节点集群环境。 3. 前提假设 - 您对Linux操作系统有一定的了解,因为Hadoop通常部署在Linux环境...
在IT行业中,Hadoop是一个广泛使用的开源框架,...在实际生产环境中,Hadoop通常部署在多台机器上,以实现更高的可用性和性能。在单机版中,虽然无法完全体验到这些特性,但它仍然是学习和测试Hadoop功能的良好起点。
本文档旨在为初学者提供一个清晰、详尽的Hadoop部署流程,包括单机伪分布模式和多节点集群的安装与配置,帮助读者快速理解Hadoop的核心概念和实际操作。 1.2 背景 在Linux环境下部署Hadoop,需要对操作系统有基本的...
Hadoop单机模式是初学者和开发者在本地环境中快速测试和学习Hadoop框架的一种方式。在这种模式下,所有的Hadoop组件(包括NameNode、DataNode、JobTracker和TaskTracker)都在同一个JVM进程中运行,不涉及网络通信,...
这包括设置环境变量、修改配置文件(如`core-site.xml`、`hdfs-site.xml`),确保Hadoop能够以本地模式运行。启动Hadoop后,我们可以通过`hadoop fs`命令行工具来操作HDFS,验证安装是否成功。 2. **HBase单机版**...
5. 配置Hadoop单机模式:修改Hadoop配置文件,让Hadoop运行在单机模式。 6. 测试Wordcount示例:运行Hadoop自带的Wordcount示例,验证环境搭建是否成功。 搭建伪分布式开发环境的步骤大致与单机模式相似,但是需要...
本实验将指导你如何在Linux环境下安装部署Hadoop,包括单机模式、伪分布式模式和分布式模式的概述,以及如何使用Vim编辑器、配置SSH无密码登录和Java环境的安装。 1. **Hadoop 安装方式** - **单机模式**:这是...
本实验将引导你完成在CentOS 6操作系统上安装Hadoop的过程,涵盖单机模式、伪分布式模式以及分布式模式的安装。这些模式各有特点,适用于不同的学习和开发需求。\n\n**一、单机模式安装**\n\n1. **环境准备**:首先...