参考:http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/SingleCluster.html
照抄:安装成功:
Hadoop2.6安装
<!--[if !supportLists]-->1.<!--[endif]-->解压目录:/usr/local/hadoop-2.6.0
<!--[if !supportLists]-->2.<!--[endif]-->vi etc/hadoop/hadoop-env.sh
25 export JAVA_HOME=/usr/local/java/jdk7
26 export export HADOOP_PREFIX=/usr/local/hadoop-2.6.0
<!--[if !supportLists]-->3.<!--[endif]-->Pseudo-Distributed Operation伪分布式
配置:
<!--[if !supportLists]-->(1)<!--[endif]-->vi etc/hadoop/core-site.xml
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
<!--[if !supportLists]-->(2)<!--[endif]-->vi etc/hadoop/hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
4. 免密码ssh设置ssh localhost
省略。。。
<!--[if !supportLists]-->5.<!--[endif]-->执行命令:
(1)格式化文件系统: $ bin/hdfs namenode -format
(2)启动NN守护和DN守护进程 $ sbin/start-dfs.sh
6. Web接口访问http://namenode:50070/
到了这里死活打不开,想了想,可能是我的主机访问不了虚拟机,于是ping IP 192.168.1.100可以ping通;
于是打开windows C:\Windows\System32\drivers\etc\hosts
加入:192.168.1.100namenode
直接再打开192.168.1.100namenode
OK
7. 创建dfs目录准备执行mapred job: hadoop是系统用户名
$ bin/hdfs dfs -mkdir /user $ bin/hdfs dfs -mkdir /user/hadoop
8复制本地的input文件夹到 分布式文件系统中
bin/hdfs dfs -put etc/hadoop input
9执行share里的mapred程序检验运行.
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar grep input output 'dfs[a-z]+'
<!--[if !supportLists]-->10.<!--[endif]-->复制执行结果到本地文件夹
bin/hdfs dfs -get output output
查看执行结果 cat output/*
相关推荐
本文将详细介绍如何在 CentOS 6.5 环境中部署 Hadoop 2.6 伪分布式环境,包括环境准备、Hadoop 安装、配置和测试等步骤。 环境准备 在开始部署 Hadoop 之前,需要准备好 Linux 环境。这里选择 CentOS 6.5 作为操作...
在这个配置中,NameNode的数据存储在`/usr/hadoop/hdfs/name`,DataNode的数据存储在`/usr/hadoop/hdfs/data`,且副本数设置为1(伪分布式模式通常只需要1个副本)。 `mapred-site.xml`则设置了MapReduce作业的...
2、大数据环境-安装Hadoop2.5.2伪分布式傻瓜教程 原创
hadoop2.4.1伪分布式搭建
### Hadoop伪分布式模式配置与安装详解 #### 一、前言 在深入探讨Hadoop伪分布式模式的配置与安装之前,我们先简单回顾一下Hadoop的基本概念以及它为何重要。Hadoop是一个开源框架,用于分布式存储和处理大规模...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
在Windows环境下,Hadoop通常以伪分布式模式运行,即在一个单一节点上模拟分布式环境。 Hive是基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。Hive1.2.2版本与Hadoop2.6...
**Hadoop 2.6的伪分布式安装** 在伪分布式模式下,所有的Hadoop组件都运行在一个单一节点上,这对于测试和学习Hadoop的环境配置非常有用。以下是安装步骤的关键知识点: 1. **环境准备**:确保你的系统满足Java环境...
最近自学hadoop2.0.0伪分布式搭建,都是一边学一边记录的 个人认为只要是稍微熟悉linux的都能看懂并搭建成功 分有点高,考虑好在下载
5. **安装Hadoop**:从Apache官方网站下载Hadoop3.1的源码或二进制包,解压到指定目录(如`/usr/local/hadoop`)。配置Hadoop环境变量,编辑`/etc/profile`文件,添加Hadoop路径和相关环境变量。 6. **配置Hadoop伪...
### Hadoop伪分布式安装知识点详解 #### 一、Hadoop伪分布式概述 Hadoop是一种能够处理海量数据的大规模分布式计算框架。它通过将任务分解到多个计算机节点上并行处理来提高数据处理效率。Hadoop支持多种运行模式,...
【Hadoop 伪分布式搭建详解】 在搭建 Hadoop 2.6.5 伪分布式环境时,我们需要经历一系列步骤,确保所有必要的组件正确配置。以下是一个详细的指南: 1. **安装基础工具**: - `ssh`:用于远程登录和无密码登录。 ...
Hadoop单机伪分布式安装 Hadoop 是一个开源的大数据处理框架,由 Apache 软件基金会开发和维护。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System)、MapReduce 和 YARN(Yet Another Resource ...
大数据hadoop平台伪分布式搭建详细步骤,基于ubtuntu系统,供初学者学习使用。... 大数据hadoop平台伪分布式搭建详细步骤,基于ubtuntu系统,供初学者学习使用。...
标题 "hadoop2.6 hadoop.dll+winutils.exe" 提到的是Hadoop 2.6版本中的两个关键组件:`hadoop.dll` 和 `winutils.exe`,这两个组件对于在Windows环境中配置和运行Hadoop至关重要。Hadoop原本是为Linux环境设计的,...
大数据hadoop安装伪分布式成熟虚拟机镜像,只需改本地虚拟网卡ip地址为192.168.6.1,网关192.168.6.2即可