- 浏览: 24877 次
- 性别:
- 来自: 上海
最新评论
环境:
hadoop1.2.0
配置
修改conf/core-site.xml
修改conf/hdfs-site.xml
修改conf/mapred-site.xml
初始化
启动
验证
http://node04vm01:50030
http://node04vm01:50070
wordcount
drwxr-xr-x - hue supergroup 0 2013-08-28 06:06 /test/input
-rw-r--r-- 1 hue supergroup 8976 2013-08-28 06:06 /test/input/chapter1.txt
13/08/28 06:11:14 INFO input.FileInputFormat: Total input paths to process : 1
13/08/28 06:11:14 INFO util.NativeCodeLoader: Loaded the native-hadoop library
13/08/28 06:11:14 WARN snappy.LoadSnappy: Snappy native library not loaded
13/08/28 06:11:14 INFO mapred.JobClient: Running job: job_201308280534_0001
13/08/28 06:11:15 INFO mapred.JobClient: map 0% reduce 0%
13/08/28 06:11:22 INFO mapred.JobClient: map 100% reduce 0%
13/08/28 06:11:32 INFO mapred.JobClient: map 100% reduce 33%
13/08/28 06:11:33 INFO mapred.JobClient: map 100% reduce 100%
13/08/28 06:11:34 INFO mapred.JobClient: Job complete: job_201308280534_0001
13/08/28 06:11:34 INFO mapred.JobClient: Counters: 29
13/08/28 06:11:34 INFO mapred.JobClient: Job Counters
13/08/28 06:11:34 INFO mapred.JobClient: Launched reduce tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=6197
13/08/28 06:11:34 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0
13/08/28 06:11:34 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0
13/08/28 06:11:34 INFO mapred.JobClient: Launched map tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: Data-local map tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=10546
13/08/28 06:11:34 INFO mapred.JobClient: File Output Format Counters
13/08/28 06:11:34 INFO mapred.JobClient: Bytes Written=6128
13/08/28 06:11:34 INFO mapred.JobClient: FileSystemCounters
13/08/28 06:11:34 INFO mapred.JobClient: FILE_BYTES_READ=8632
13/08/28 06:11:34 INFO mapred.JobClient: HDFS_BYTES_READ=9086
13/08/28 06:11:34 INFO mapred.JobClient: FILE_BYTES_WRITTEN=124965
13/08/28 06:11:34 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=6128
13/08/28 06:11:34 INFO mapred.JobClient: File Input Format Counters
13/08/28 06:11:34 INFO mapred.JobClient: Bytes Read=8976
13/08/28 06:11:34 INFO mapred.JobClient: Map-Reduce Framework
13/08/28 06:11:34 INFO mapred.JobClient: Map output materialized bytes=8632
13/08/28 06:11:34 INFO mapred.JobClient: Map input records=14
13/08/28 06:11:34 INFO mapred.JobClient: Reduce shuffle bytes=8632
13/08/28 06:11:34 INFO mapred.JobClient: Spilled Records=1260
13/08/28 06:11:34 INFO mapred.JobClient: Map output bytes=15111
13/08/28 06:11:34 INFO mapred.JobClient: Total committed heap usage (bytes)=189726720
13/08/28 06:11:34 INFO mapred.JobClient: CPU time spent (ms)=2620
13/08/28 06:11:34 INFO mapred.JobClient: Combine input records=1547
13/08/28 06:11:34 INFO mapred.JobClient: SPLIT_RAW_BYTES=110
13/08/28 06:11:34 INFO mapred.JobClient: Reduce input records=630
13/08/28 06:11:34 INFO mapred.JobClient: Reduce input groups=630
13/08/28 06:11:34 INFO mapred.JobClient: Combine output records=630
13/08/28 06:11:34 INFO mapred.JobClient: Physical memory (bytes) snapshot=285716480
13/08/28 06:11:34 INFO mapred.JobClient: Reduce output records=630
13/08/28 06:11:34 INFO mapred.JobClient: Virtual memory (bytes) snapshot=1533976576
13/08/28 06:11:34 INFO mapred.JobClient: Map output records=1547
hadoop1.2.0
配置
修改conf/core-site.xml
<configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration>
修改conf/hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.permissions</name> <value>false</value> </property> </configuration>
修改conf/mapred-site.xml
<configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
初始化
bin/hadoop namenode -format
启动
bin/start-all.sh
验证
http://node04vm01:50030
http://node04vm01:50070
wordcount
bin/hadoop fs -mkdir /test/input bin/hadoop fs -put ~/test/senseandsensibility/chapter1.txt /test/input/ bin/hadoop fs -lsr /test
drwxr-xr-x - hue supergroup 0 2013-08-28 06:06 /test/input
-rw-r--r-- 1 hue supergroup 8976 2013-08-28 06:06 /test/input/chapter1.txt
bin/hadoop jar hadoop-examples-1.2.0.jar wordcount /test/input /test/output
13/08/28 06:11:14 INFO input.FileInputFormat: Total input paths to process : 1
13/08/28 06:11:14 INFO util.NativeCodeLoader: Loaded the native-hadoop library
13/08/28 06:11:14 WARN snappy.LoadSnappy: Snappy native library not loaded
13/08/28 06:11:14 INFO mapred.JobClient: Running job: job_201308280534_0001
13/08/28 06:11:15 INFO mapred.JobClient: map 0% reduce 0%
13/08/28 06:11:22 INFO mapred.JobClient: map 100% reduce 0%
13/08/28 06:11:32 INFO mapred.JobClient: map 100% reduce 33%
13/08/28 06:11:33 INFO mapred.JobClient: map 100% reduce 100%
13/08/28 06:11:34 INFO mapred.JobClient: Job complete: job_201308280534_0001
13/08/28 06:11:34 INFO mapred.JobClient: Counters: 29
13/08/28 06:11:34 INFO mapred.JobClient: Job Counters
13/08/28 06:11:34 INFO mapred.JobClient: Launched reduce tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=6197
13/08/28 06:11:34 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0
13/08/28 06:11:34 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0
13/08/28 06:11:34 INFO mapred.JobClient: Launched map tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: Data-local map tasks=1
13/08/28 06:11:34 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=10546
13/08/28 06:11:34 INFO mapred.JobClient: File Output Format Counters
13/08/28 06:11:34 INFO mapred.JobClient: Bytes Written=6128
13/08/28 06:11:34 INFO mapred.JobClient: FileSystemCounters
13/08/28 06:11:34 INFO mapred.JobClient: FILE_BYTES_READ=8632
13/08/28 06:11:34 INFO mapred.JobClient: HDFS_BYTES_READ=9086
13/08/28 06:11:34 INFO mapred.JobClient: FILE_BYTES_WRITTEN=124965
13/08/28 06:11:34 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=6128
13/08/28 06:11:34 INFO mapred.JobClient: File Input Format Counters
13/08/28 06:11:34 INFO mapred.JobClient: Bytes Read=8976
13/08/28 06:11:34 INFO mapred.JobClient: Map-Reduce Framework
13/08/28 06:11:34 INFO mapred.JobClient: Map output materialized bytes=8632
13/08/28 06:11:34 INFO mapred.JobClient: Map input records=14
13/08/28 06:11:34 INFO mapred.JobClient: Reduce shuffle bytes=8632
13/08/28 06:11:34 INFO mapred.JobClient: Spilled Records=1260
13/08/28 06:11:34 INFO mapred.JobClient: Map output bytes=15111
13/08/28 06:11:34 INFO mapred.JobClient: Total committed heap usage (bytes)=189726720
13/08/28 06:11:34 INFO mapred.JobClient: CPU time spent (ms)=2620
13/08/28 06:11:34 INFO mapred.JobClient: Combine input records=1547
13/08/28 06:11:34 INFO mapred.JobClient: SPLIT_RAW_BYTES=110
13/08/28 06:11:34 INFO mapred.JobClient: Reduce input records=630
13/08/28 06:11:34 INFO mapred.JobClient: Reduce input groups=630
13/08/28 06:11:34 INFO mapred.JobClient: Combine output records=630
13/08/28 06:11:34 INFO mapred.JobClient: Physical memory (bytes) snapshot=285716480
13/08/28 06:11:34 INFO mapred.JobClient: Reduce output records=630
13/08/28 06:11:34 INFO mapred.JobClient: Virtual memory (bytes) snapshot=1533976576
13/08/28 06:11:34 INFO mapred.JobClient: Map output records=1547
发表评论
-
[实验]avro与non-avro的mapred例子-wordcount改写
2013-09-03 16:15 1046avro非常适合用于hadoop。在开发的时候可能有这样的场景 ... -
[实验]hadoop例子 trackinfo数据清洗的改写
2013-09-03 10:42 1083之前的“trackinfo数据清洗”例子中为使用combine ... -
[笔记]hadoop tutorial - Reducer
2013-09-03 10:15 733引用Reducer reduces a set of inte ... -
[实验]hadoop例子 trackinfo数据清洗
2013-09-02 17:24 2566业务场景: 假设用户在某处(例如某个网页或者某个地点)的活动会 ... -
[环境] hadoop 开发环境maven管理
2013-09-02 17:02 1463贴一下整理的maven管理配置(待补充) <proj ... -
[笔记]avro 介绍及官网例子
2013-09-02 14:22 3891Apache Avro是一个独立于编程语言的数据序列化系统。旨 ... -
[实验]hadoop例子 在线用户分析
2013-08-30 15:54 899一个简单的业务场景和例子。由wordcount例子改写。 业 ... -
[笔记]hadoop mapred InputFormat分析
2013-08-30 13:43 1269Hadoop MapReduce的编程接口层主要有5个可编程组 ... -
[笔记]hdfs namenode FSNamesystem分析
2013-08-30 09:18 1152NameNode在内存中维护整个文件系统的元数据镜像,用于HD ... -
[笔记]hdfs namenode FSImage分析1
2013-08-29 15:10 1880元数据文件fsimage的分析 fsimage为元数据镜像文件 ... -
[实验]集群hadoop配置
2013-08-28 16:53 854环境 hadoop1.2.0 CentOS release ... -
[问题解决]hadoop eclipse plugin
2013-08-27 09:22 979环境: hadoop 1.2.0 问题: eclipse报错& ...
相关推荐
通过亲自实验和实践,本教程将带您掌握单机Hadoop配置安装的所有步骤。 Hadoop介绍 Hadoop是Apache基金会下的开源项目,主要用于大数据处理和分析。Hadoop架构主要包括HDFS(Hadoop Distributed File System)、...
实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程,包括环境配置、WordCount程序的实现以及实验结果分析。本实验旨在理解Hadoop分布式计算的基本原理,并熟悉Hadoop集群的搭建与管理。 #...
6. **伪分布式模式操作**:修改Hadoop配置文件,启动Hadoop服务,再次运行WordCount,以验证伪分布式模式的正确性。 **实验过程记录:** 实验过程中,学生按照上述步骤逐步操作,确保每个环节都按要求完成。在安装...
4. **配置Hadoop**:修改Hadoop配置文件`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`,设置HDFS的命名节点、数据节点以及MapReduce的相关参数。 5. **格式化NameNode**:首次启动Hadoop前,需要对NameNode...
Hadoop的安装过程可以按照官方文档进行,整个过程包括了在Java JDK和JRE的安装、SSH服务的开启以及Hadoop配置文件的设置。首先,需要下载最新的稳定版本的Hadoop,然后按照官方文档进行安装和配置。 1.1、Java JDK...
实验一:“安装单机Hadoop1”主要涵盖了在Linux环境下安装和配置Hadoop伪分布式系统的步骤,以及在Hadoop上运行WordCount示例程序。以下是详细的实验知识点: 1. **JDK安装**:首先,安装Java Development Kit (JDK...
根据给定文件的信息,我们可以总结出以下几个重要的知识点: ...综上所述,通过本次实验,学生不仅能够学会如何在Linux虚拟机中搭建Hadoop集群,还能掌握Hadoop的基本使用技巧,为进一步学习大数据分析打下坚实基础。
环境变量中定义了一些重要的路径和配置信息,如ORACLE_HOME、HADOOP_HOME、ORACLE_SID等,它们确保了程序能够正确地定位到软件安装目录、Hadoop配置目录和数据库实例等。 在实验中,需要先检查环境变量是否正确设置...
这个实验的主要目的是学习Hadoop的安装、配置和基础操作。通过实践,加深了对Hadoop环境搭建的理解,也体验到了解决安装过程中遇到问题的过程。Hadoop的分布式特性使得它在处理大量数据时表现出高效性和容错性,适合...
**修改Hadoop配置**:与单机模式类似,但需在`hdfs-site.xml`中设置`dfs.replication`为2或更多,表示在集群中需要多个副本。\n\n3. **启动Hadoop**:与单机模式不同,需要模拟多节点环境,因此需用Hadoop的`bin/...
本实验文档集合了对Hadoop在不同环境下的部署和操作实践,包括单机伪分布和完全分布的模式,以及相关的云计算技术介绍。以下是这些知识点的详细阐述: 1. **Hadoop单机伪分布模式**: 单机伪分布模式是Hadoop初学...
### Hadoop3.1.3安装与单机/伪分布式配置知识点详解 #### 一、实验目的和要求 - **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 ...
- 修改Hadoop配置文件,如`core-site.xml`,`hdfs-site.xml`,`mapred-site.xml`和`yarn-site.xml`,配置HDFS、MapReduce和YARN的相关参数。 - 初始化NameNode:`hadoop namenode -format` - 启动Hadoop服务,...
单机安装配置涉及修改配置文件,如core-site.xml和hdfs-site.xml,以便Hadoop可以正确地在本地机器上运行。伪分布式安装则模拟多节点环境,但所有组件都在同一台机器上运行,这对于测试和学习非常有用。启动Hadoop后...
Hadoop云计算实验报告的目的是通过在Ubuntu虚拟机上安装和配置Hadoop,以理解Hadoop的分布式计算模型,并利用Hadoop处理大数据。实验中,我们将在单机模式和集群模式下运行一个简单的数据分析程序,统计软件代理系统...
- 编辑Hadoop配置文件,主要修改 `hadoop-env.sh` 和 `core-site.xml`: - 在 `hadoop-env.sh` 中设置 `JAVA_HOME` 指向你的Java安装路径。 - 在 `core-site.xml` 中配置HDFS的默认FS为本地文件系统,例如 `...
资源名称:linux hadoop搭建手册以及三种集群模式配置内容简介: linux hadoop搭建手册以及三种集群模式配置前半部分主要讲述了环境配置 环境配置环境配置;后半部分主要讲述Hadoop集群有三种运行模式,分别为单机...
通过实践这个配置指南,你将理解如何在Ubuntu环境下搭建Hadoop单机环境,掌握分布式编程模式MapReduce,以及如何解决实际的大数据处理问题。这将有助于你深入理解云计算环境下的数据处理,为后续的Hadoop开发和大...