`
sonyfe25cp
  • 浏览: 204795 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

安装单机模式hadoop的流程

阅读更多
安装环境:
Ubuntu 9.10
hadoop 0.20.2

1.安装ssh服务

1) sudo apt-get install openssh-server
2) 生成key用于 ssh localhost 的时候不用输入密码
$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

这时候,如果提示:Agent admitted failure to sign using the key.
$ ssh-agent
$ ssh-add id_rsa   //这行在~/.ssh/内执行的

3) ssh local
如果提示: ssh: connect to host 133.133.133.65 port 22: Connection refused
方法一(推荐):
修改/etc/passwd文件,在其中加入
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
参考
http://www.unixguide.net/comments/sun/ssh_installation.shtml/37.shtml
http://www.gipsky.com/modules/newbb/viewtopic.php?topic_id=966

方法二(不推荐):
修改/etc/ssh/sshd_config文件
将其中
UsePrivilegeSeparation yes
修改为
UsePrivilegeSeparation no
虽然能解决问题,但是降低了ssh的安全级别

4)这时候 ssh local 真的不需要密码就可以登录了..

2.安装jdk

这个就不需要说了..配出来java -v就行了

3.安装hadoop

1)解压到/opt/hadoop
$ tar zxvf hadoop-0.20.2.tar.gz
$ sudo mv hadoop-0.20.2 /opt/
$ sudo chown -R hadoop:hadoop /opt/hadoop-0.20.2
$ sudo ln -sf /opt/hadoop-0.20.2 /opt/hadoop


4.配置 hadoop-env.sh

1)在hadoop/conf 里面hadoop-env.sh增加
export JAVA_HOME=/usr/jdk1.6.0.18
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:/opt/hadoop/bin


5.配置文件

1)編輯 /opt/hadoop/conf/core-site.xml
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/tmp/hadoop/hadoop-${user.name}</value>
  </property>
</configuration>


2)編輯 /opt/hadoop/conf/hdfs-site.xml
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>


3)編輯 /opt/hadoop/conf/mapred-site.xml
<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
  </property>
</configuration>


6.格式化hdfs
$ cd /opt/hadoop
$ source conf/hadoop-env.sh
$ hadoop namenode -format

提示信息一大堆...


7.启动hadoop
$ sudo ./start-all.sh  //在hadoop/bin下执行


8.完成后的测试
http://localhost:50030/ - Hadoop 管理接口 


后续还会继续补充...............



分享到:
评论

相关推荐

    单机版hadoop配置文件

    总结,Hadoop 2.2.0的单机伪分布式配置是一个基础且实用的学习实践,它涵盖了Hadoop的核心概念和操作流程。通过这个配置,你可以在一个可控的环境中体验Hadoop的工作原理,为进一步深入理解和掌握分布式大数据处理...

    Hadoop单机模式和伪分布模式.ppt

    **Hadoop单机模式与伪分布模式详解** Hadoop是一个开源的分布式计算框架,它允许在廉价硬件上处理大规模数据集。Hadoop提供了多种运行模式,以满足不同环境的需求,其中最常见的两种是单机模式(Local Mode)和伪...

    ubuntu hadoop单机模式安装详解.docx

    在本文档中,我们将详细讲解如何在Ubuntu 11.10操作系统上进行Hadoop的单机模式安装。Hadoop是一个开源的分布式计算框架,它允许在大规模集群中处理大数据。在单机模式下,Hadoop可以在一台计算机上模拟分布式环境,...

    Linux下Hadoop单机配置文档

    通过本教程的学习,读者可以了解Hadoop单机模式的配置流程,并能够通过一个简单的WordCount程序来验证Hadoop的安装是否成功。需要注意的是,本文档使用的Hadoop版本较为陈旧,对于实际生产环境中Hadoop的配置和使用...

    hadoop 单机安装和集群安装总结

    ### Hadoop单机安装与集群安装相关知识点 ...通过以上步骤,您可以顺利完成Hadoop的单机安装与集群安装,并且能够理解Hadoop的基本配置流程。这对于进一步学习大数据处理和分布式计算具有重要的意义。

    基于单机的Hadoop伪分布式运行模拟实现

    通过这个过程,不仅可以熟悉Hadoop的基本配置,还能深入理解Hadoop的工作流程,为进一步学习Hadoop的高级特性,如HBase、Hive、Spark等打下坚实基础。对于任何希望涉足大数据处理的IT从业者来说,这都是一个值得投入...

    hadoop安装

    本文将详细介绍如何在 Linux 系统下安装 Hadoop,并逐步指导您完成从单机模式到伪分布式模式的配置过程。此外,还会涉及 Spark 和 HBase 的安装步骤。 #### 二、Hadoop 单机安装 **前提条件**: - 所有操作均在...

    hadoop-0.20.205.0和hbase-0.90.5,集群和单机 安装配置

    本文将详细介绍如何在三台虚拟机上安装配置Hadoop-0.20.205.0和HBase-0.90.5,包括单机模式和集群模式的安装配置流程。 #### 二、环境准备 首先,我们需要准备三台虚拟机,并安装CentOS-5.7操作系统。这三台虚拟机...

    Hadoop云计算实验报告

    本实验报告将详细阐述在Ubuntu虚拟机环境下,如何搭建Hadoop的单机模式和集群模式,并介绍如何编写一个基于Hadoop的数据处理程序,以及在不同模式下运行该程序的过程。 ### 一、Hadoop简介 Hadoop的核心组件包括...

    大数据云计算技术系列 hadoop单机版搭建图文详解(共14页).pdf

    -- 单机模式下,副本数设为1 --&gt; ``` 4. 配置conf/hdfs-site.xml,指定HDFS的相关参数,例如namenode和datanode的地址。 启动和测试Hadoop: 1. 初始化NameNode和DataNode,执行`bin/hadoop namenode -format`...

    使用hadoop实现WordCount实验报告.docx

    **使用Hadoop实现WordCount实验报告** 实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程,包括...此外,实验过程锻炼了解决问题的能力,对Hadoop的整体架构和工作流程有了更直观的认识。

    hadoop环境配置(单机集群)

    本文旨在详细介绍如何在虚拟机上安装Hadoop环境,并搭建单机集群。通过图文并茂的方式,帮助读者深入理解每一个步骤。 #### 二、准备工作 为了确保安装过程顺利进行,首先需要准备以下环境: - **虚拟机版本**:VM...

    Hadoop完全分布模式安装.pdf

    在开始深入了解Hadoop完全分布模式安装之前,首先需要了解Hadoop运行模式的三种类型:本地运行模式、伪分布运行模式和完全分布式运行模式。本地运行模式仅在单机上模拟分布式计算;伪分布运行模式则是在单机上运行...

    ubuntu环境下hadoop环境搭建(伪分布模式)

    在Ubuntu环境下搭建Hadoop伪分布式模式,主要是为了模拟多节点Hadoop集群的环境,以便于学习和测试Hadoop的功能。这个过程涉及到多个步骤,包括必要的资源下载、软件安装、环境配置以及Hadoop服务的启动与验证。以下...

    Hadoop集群和单机数据处理的耗时对比实验

    随后,对关键配置文件进行修改,包括设置JAVA_HOME环境变量,调整Hadoop运行模式为分布式,以及更新masters和slaves文件,分别指定主节点和从节点列表。 5. **集群部署与初始化**:利用scp命令将Hadoop软件部署至...

    Hadoop安装配置与部署运行

    - Pseudo-Distributed Mode:伪分布式模式,单机模拟多节点环境。 - Fully-Distributed Mode:全分布式模式,真正的多节点集群环境。 3. 前提假设 - 您对Linux操作系统有一定的了解,因为Hadoop通常部署在Linux环境...

    Hadoop集群安装配置教程_Hadoop2.62

    它假设读者已经具备了Hadoop单机或伪分布式配置的基础知识。 **环境配置** 教程以Ubuntu 14.04 64位作为示例操作系统,并且在Hadoop 2.6.0稳定版上进行了验证。集群环境通常由至少两个节点构成:一个作为Master节点...

    Hadoop安装配置说明.doc

    在本文档中,我们将深入探讨如何安装配置Hadoop,涵盖了单机模式和伪分布式模式的详细步骤。Hadoop是一个开源的分布式计算框架,主要用于处理和存储海量数据。它基于Java编程语言,支持跨多台机器进行数据处理,是大...

Global site tag (gtag.js) - Google Analytics