安装环境:
Ubuntu 9.10
hadoop 0.20.2
1.安装ssh服务
1) sudo apt-get install openssh-server
2) 生成key用于 ssh localhost 的时候不用输入密码
$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
这时候,如果提示:Agent admitted failure to sign using the key.
$ ssh-agent
$ ssh-add id_rsa //这行在~/.ssh/内执行的
3) ssh local
如果提示: ssh: connect to host 133.133.133.65 port 22: Connection refused
方法一(推荐):
修改/etc/passwd文件,在其中加入
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
参考
http://www.unixguide.net/comments/sun/ssh_installation.shtml/37.shtml
http://www.gipsky.com/modules/newbb/viewtopic.php?topic_id=966
方法二(不推荐):
修改/etc/ssh/sshd_config文件
将其中
UsePrivilegeSeparation yes
修改为
UsePrivilegeSeparation no
虽然能解决问题,但是降低了ssh的安全级别
4)这时候 ssh local 真的不需要密码就可以登录了..
2.安装jdk
这个就不需要说了..配出来java -v就行了
3.安装hadoop
1)解压到/opt/hadoop
$ tar zxvf hadoop-0.20.2.tar.gz
$ sudo mv hadoop-0.20.2 /opt/
$ sudo chown -R hadoop:hadoop /opt/hadoop-0.20.2
$ sudo ln -sf /opt/hadoop-0.20.2 /opt/hadoop
4.配置 hadoop-env.sh
1)在hadoop/conf 里面hadoop-env.sh增加
export JAVA_HOME=/usr/jdk1.6.0.18
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:/opt/hadoop/bin
5.配置文件
1)編輯 /opt/hadoop/conf/core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/tmp/hadoop/hadoop-${user.name}</value>
</property>
</configuration>
2)編輯 /opt/hadoop/conf/hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
3)編輯 /opt/hadoop/conf/mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
6.格式化hdfs
$ cd /opt/hadoop
$ source conf/hadoop-env.sh
$ hadoop namenode -format
提示信息一大堆...
7.启动hadoop
$ sudo ./start-all.sh //在hadoop/bin下执行
8.完成后的测试
http://localhost:50030/ - Hadoop 管理接口
后续还会继续补充...............
分享到:
相关推荐
总结,Hadoop 2.2.0的单机伪分布式配置是一个基础且实用的学习实践,它涵盖了Hadoop的核心概念和操作流程。通过这个配置,你可以在一个可控的环境中体验Hadoop的工作原理,为进一步深入理解和掌握分布式大数据处理...
**Hadoop单机模式与伪分布模式详解** Hadoop是一个开源的分布式计算框架,它允许在廉价硬件上处理大规模数据集。Hadoop提供了多种运行模式,以满足不同环境的需求,其中最常见的两种是单机模式(Local Mode)和伪...
在本文档中,我们将详细讲解如何在Ubuntu 11.10操作系统上进行Hadoop的单机模式安装。Hadoop是一个开源的分布式计算框架,它允许在大规模集群中处理大数据。在单机模式下,Hadoop可以在一台计算机上模拟分布式环境,...
通过本教程的学习,读者可以了解Hadoop单机模式的配置流程,并能够通过一个简单的WordCount程序来验证Hadoop的安装是否成功。需要注意的是,本文档使用的Hadoop版本较为陈旧,对于实际生产环境中Hadoop的配置和使用...
### Hadoop单机安装与集群安装相关知识点 ...通过以上步骤,您可以顺利完成Hadoop的单机安装与集群安装,并且能够理解Hadoop的基本配置流程。这对于进一步学习大数据处理和分布式计算具有重要的意义。
通过这个过程,不仅可以熟悉Hadoop的基本配置,还能深入理解Hadoop的工作流程,为进一步学习Hadoop的高级特性,如HBase、Hive、Spark等打下坚实基础。对于任何希望涉足大数据处理的IT从业者来说,这都是一个值得投入...
本文将详细介绍如何在 Linux 系统下安装 Hadoop,并逐步指导您完成从单机模式到伪分布式模式的配置过程。此外,还会涉及 Spark 和 HBase 的安装步骤。 #### 二、Hadoop 单机安装 **前提条件**: - 所有操作均在...
本文将详细介绍如何在三台虚拟机上安装配置Hadoop-0.20.205.0和HBase-0.90.5,包括单机模式和集群模式的安装配置流程。 #### 二、环境准备 首先,我们需要准备三台虚拟机,并安装CentOS-5.7操作系统。这三台虚拟机...
本实验报告将详细阐述在Ubuntu虚拟机环境下,如何搭建Hadoop的单机模式和集群模式,并介绍如何编写一个基于Hadoop的数据处理程序,以及在不同模式下运行该程序的过程。 ### 一、Hadoop简介 Hadoop的核心组件包括...
-- 单机模式下,副本数设为1 --> ``` 4. 配置conf/hdfs-site.xml,指定HDFS的相关参数,例如namenode和datanode的地址。 启动和测试Hadoop: 1. 初始化NameNode和DataNode,执行`bin/hadoop namenode -format`...
**使用Hadoop实现WordCount实验报告** 实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程,包括...此外,实验过程锻炼了解决问题的能力,对Hadoop的整体架构和工作流程有了更直观的认识。
本文旨在详细介绍如何在虚拟机上安装Hadoop环境,并搭建单机集群。通过图文并茂的方式,帮助读者深入理解每一个步骤。 #### 二、准备工作 为了确保安装过程顺利进行,首先需要准备以下环境: - **虚拟机版本**:VM...
在开始深入了解Hadoop完全分布模式安装之前,首先需要了解Hadoop运行模式的三种类型:本地运行模式、伪分布运行模式和完全分布式运行模式。本地运行模式仅在单机上模拟分布式计算;伪分布运行模式则是在单机上运行...
在Ubuntu环境下搭建Hadoop伪分布式模式,主要是为了模拟多节点Hadoop集群的环境,以便于学习和测试Hadoop的功能。这个过程涉及到多个步骤,包括必要的资源下载、软件安装、环境配置以及Hadoop服务的启动与验证。以下...
随后,对关键配置文件进行修改,包括设置JAVA_HOME环境变量,调整Hadoop运行模式为分布式,以及更新masters和slaves文件,分别指定主节点和从节点列表。 5. **集群部署与初始化**:利用scp命令将Hadoop软件部署至...
- Pseudo-Distributed Mode:伪分布式模式,单机模拟多节点环境。 - Fully-Distributed Mode:全分布式模式,真正的多节点集群环境。 3. 前提假设 - 您对Linux操作系统有一定的了解,因为Hadoop通常部署在Linux环境...
它假设读者已经具备了Hadoop单机或伪分布式配置的基础知识。 **环境配置** 教程以Ubuntu 14.04 64位作为示例操作系统,并且在Hadoop 2.6.0稳定版上进行了验证。集群环境通常由至少两个节点构成:一个作为Master节点...
在本文档中,我们将深入探讨如何安装配置Hadoop,涵盖了单机模式和伪分布式模式的详细步骤。Hadoop是一个开源的分布式计算框架,主要用于处理和存储海量数据。它基于Java编程语言,支持跨多台机器进行数据处理,是大...