`
sunasheng
  • 浏览: 122619 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

Ubuntu下Hadoop的集群版的安装

阅读更多

UbuntuHadoop集群版的安装

0,准备两个服务器

机器名    IP        作用

hadoop.main   192.168.1.102    NameNode,JobTracker,DataNode,TaskTracker

hadoop.slave   192.168.1.107    DataNode,TaskTracker

注意:两台主机必须使用相同的用户名运行

1,安装ssh

sudo apt-get install ssh

2,安装rsync

sudo apt-get install rsync

3,配置ssh免密码登录

ssh-keygen -t rsa -p '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

验证是否成功

ssh localhost

4,配置JDK环境和下载hadoop 1.0.3

JDK 安装路径为~/home/app/jdk1.6.0_30

Hadoop 1.0.3路径为~/hadoop-1.0.3

5,修改hadoop配置文件,指定jdk安装路径

vi conf/hadoop-env.sh

export JAVA_HOME=/home/app/jdk1.6.0_30

6,修改hadoop核心配置文件core-site.xml,配置HDFS的地址和端口号

vi conf/core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

7,修改HadoopHDFS配置,修改replication

vi conf/hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

8,修改HadoopMapReduce的配置文件,配置的是JobTracker的地址和端口

vi conf/mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

9,格式化Hadoop的文件系统HDFS

bin/hadoop namenode -format

10,启动Hadoop

bin/start-all.sh

11,最后验证hadoop是否安装完成,打开浏览器分别输入以下网址:

http://127.0.0.1:50030     MapReduceweb界面

http://127.0.0.1:50070   HDFSweb界面

如果能够查看说明Hadoop安装成功

12,当两台主机上都按照1-11步骤安装完成hadoop环境,那么继续13

13,/etc/hostname中修改主机名

/etc/hosts中配置主机名和IP地址对应关系

14,Hadoop.main节点中的~/.ssh/id_rsa.pub文件拷贝到hadoop.slave

~/.ssh/目录下运行:

cat ./id_rea.pub >> authorized_keys

15,分别修改两台主机中的hadoop配置文件的mastersslaves

 

分享到:
评论

相关推荐

    ubuntu下安装hadoop集群

    ubuntu下安装hadoop集群,设置ssh对其他node无密码访问

    基于Ubuntu的Hadoop简易集群安装与配置

    ##### 3.3 基于Ubuntu 14.04.5的Hadoop集群安装与配置 ###### 3.3.1 安装JDK - 在三台Ubuntu机器上安装JDK 1.6或更高版本。 - 设置环境变量,确保Hadoop能够正确识别JDK路径。 ###### 3.3.2 安装SSH免密登录 - 在...

    基于Ubuntu的hadoop集群安装与配置

    本文将详细介绍基于Ubuntu环境下的Hadoop集群安装与配置,涵盖Hadoop的基本概念、HDFS(分布式文件系统)、MapReduce(分布式计算模型)、集群架构、NameNode和DataNode的角色、JobTracker和TaskTracker的职责等方面...

    在Ubuntu上配置Hadoop集群

    ### 在Ubuntu上配置Hadoop集群的关键知识点 #### 一、任务概述 本文档旨在指导用户如何在Ubuntu系统上搭建一个分布式的Hadoop集群。通过详细的操作步骤和注意事项,确保读者能够顺利地完成集群的配置。 #### 二、...

    Linux下Hadoop集群安装指南

    Linux 下 Hadoop 集群安装指南 一、Linux 下 Hadoop 集群安装前的准备工作 在开始安装 Hadoop 集群之前,我们需要安装 VMware 和 Ubuntu Linux 作为操作系统。这一步骤非常重要,因为 Hadoop 集群需要在 Linux ...

    基于Ubuntu的hadoop集群安装与配置.pdf

    【标题】: "基于Ubuntu的hadoop集群安装与配置.pdf" 【内容概要】: 本文档主要介绍了如何在Ubuntu操作系统上安装和配置Hadoop集群,以及Hadoop的基本原理和核心组件。Hadoop是一个开源的分布式计算平台,由Apache...

    详解搭建ubuntu版hadoop集群

    【搭建Ubuntu版Hadoop集群详解】 在本文中,我们将详细阐述如何在Ubuntu 16.04环境下搭建Hadoop集群。Hadoop是一个开源的分布式计算框架,它允许处理和存储大量数据,尤其适合大数据分析。Ubuntu是Linux发行版中的...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结: 1. 安装前的准备工作:创建 hadoop 用户,设置密码,增加...

    Hadoop集群自动安装

    "Hadoop集群自动安装"是指通过自动化脚本或工具来快速部署和配置Hadoop环境,从而节省手动安装过程中所需的时间和精力。这样的自动化过程对于大规模的Hadoop集群尤其重要,因为它能确保一致性,减少人为错误,并提高...

    基于Ubuntu的hadoop集群安装与配置.docx

    首先,我们需要准备三台主机,分别为master、slaver1和slaver2,它们将在Hadoop集群中分别担任namenode、JobTracker、datanode、TaskTracker等角色。每台主机都需要设置自己的主机名和IP地址对应关系,这可以通过...

    hadoop集群安装手册

    【Hadoop集群安装手册】 Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储海量数据。本手册将详细介绍如何在5台虚拟机上手动安装和配置Hadoop集群,供初学者和专业人士参考。 ### 安装...

    ubuntu上hadoop的安装及配置

    在本文中,我们将详细探讨如何在Ubuntu 10.10 (Maverick Meerkat)上通过VMware虚拟机安装并配置Hadoop集群。这个过程涵盖了从搭建虚拟环境到安装必要的软件,以及最终配置Hadoop分布式文件系统(HDFS)和MapReduce服务...

    两台 Ubuntu 机器实现 Hadoop 集群

    标题 "两台 Ubuntu 机器实现 Hadoop 集群" 提到的是在两台运行 Ubuntu 操作系统的计算机上搭建 Hadoop 分布式集群的过程。Hadoop 是一个由 Apache 软件基金会开发的开源框架,主要用于存储和处理大规模数据。在 ...

    Ubuntu下的Hadoop安装教程

    2. **使用虚拟光驱安装**:使用虚拟光驱软件(例如 Daemon Tools)打开 ISO 文件,并执行里面的 `wubi.exe` 程序来在 Windows 环境下安装 Ubuntu。 3. **配置参数并重启**:根据提示配置安装参数,完成安装后需要...

    linux下Hadoop集群环境搭建

    在Linux环境下搭建Hadoop集群是一项复杂但至关重要的任务,它为大数据处理提供了强大的分布式平台。以下将详细介绍如何在一台虚拟机上安装多台Linux服务节点,并构建Hadoop集群环境。 首先,我们需要准备一个基础...

    Hadoop集群搭建教程(ubuntu) (1).docx

    详细的Hadoop集群搭建过程,有6部分,前提是能连接网络,前三部都是很简单免密要仔细看,推荐JAVA版本1.8,Hadoop版本2.2.7 这两个版本都是稳定的

    安装Hadoop(单机版和集群)步骤

    3. **安装rsync**:rsync是一个用于文件同步的工具,对于Hadoop集群配置非常重要。使用`sudo apt-get install rsync`命令进行安装。 4. **配置SSH免密码登录**: - 检查`.ssh`目录是否存在,如果不存在,使用`...

Global site tag (gtag.js) - Google Analytics