Ubuntu下Hadoop的集群版的安装 0,准备两个服务器 机器名 IP 作用 hadoop.main 192.168.1.102 NameNode,JobTracker,DataNode,TaskTracker hadoop.slave 192.168.1.107 DataNode,TaskTracker 注意:两台主机必须使用相同的用户名运行 |
1,安装ssh sudo apt-get install ssh |
2,安装rsync sudo apt-get install rsync |
3,配置ssh免密码登录 ssh-keygen -t rsa -p '' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys 验证是否成功 ssh localhost |
4,配置JDK环境和下载hadoop 1.0.3 JDK 安装路径为~/home/app/jdk1.6.0_30 Hadoop 1.0.3路径为~/hadoop-1.0.3 |
5,修改hadoop配置文件,指定jdk安装路径 vi conf/hadoop-env.sh export JAVA_HOME=/home/app/jdk1.6.0_30 |
6,修改hadoop核心配置文件core-site.xml,配置HDFS的地址和端口号 vi conf/core-site.xml <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration> |
7,修改Hadoop中HDFS配置,修改replication vi conf/hdfs-site.xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> |
8,修改Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口 vi conf/mapred-site.xml <configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration> |
9,格式化Hadoop的文件系统HDFS bin/hadoop namenode -format |
10,启动Hadoop bin/start-all.sh |
11,最后验证hadoop是否安装完成,打开浏览器分别输入以下网址: http://127.0.0.1:50030 MapReduce的web界面 http://127.0.0.1:50070 HDFS的web界面 如果能够查看说明Hadoop安装成功 |
12,当两台主机上都按照1-11步骤安装完成hadoop环境,那么继续13 |
13,在/etc/hostname中修改主机名 在/etc/hosts中配置主机名和IP地址对应关系 |
14,将Hadoop.main节点中的~/.ssh/id_rsa.pub文件拷贝到hadoop.slave 的~/.ssh/目录下运行: cat ./id_rea.pub >> authorized_keys |
15,分别修改两台主机中的hadoop配置文件的masters和slaves
|
- 浏览: 122623 次
- 性别:
- 来自: 北京
相关推荐
ubuntu下安装hadoop集群,设置ssh对其他node无密码访问
##### 3.3 基于Ubuntu 14.04.5的Hadoop集群安装与配置 ###### 3.3.1 安装JDK - 在三台Ubuntu机器上安装JDK 1.6或更高版本。 - 设置环境变量,确保Hadoop能够正确识别JDK路径。 ###### 3.3.2 安装SSH免密登录 - 在...
本文将详细介绍基于Ubuntu环境下的Hadoop集群安装与配置,涵盖Hadoop的基本概念、HDFS(分布式文件系统)、MapReduce(分布式计算模型)、集群架构、NameNode和DataNode的角色、JobTracker和TaskTracker的职责等方面...
### 在Ubuntu上配置Hadoop集群的关键知识点 #### 一、任务概述 本文档旨在指导用户如何在Ubuntu系统上搭建一个分布式的Hadoop集群。通过详细的操作步骤和注意事项,确保读者能够顺利地完成集群的配置。 #### 二、...
Linux 下 Hadoop 集群安装指南 一、Linux 下 Hadoop 集群安装前的准备工作 在开始安装 Hadoop 集群之前,我们需要安装 VMware 和 Ubuntu Linux 作为操作系统。这一步骤非常重要,因为 Hadoop 集群需要在 Linux ...
【标题】: "基于Ubuntu的hadoop集群安装与配置.pdf" 【内容概要】: 本文档主要介绍了如何在Ubuntu操作系统上安装和配置Hadoop集群,以及Hadoop的基本原理和核心组件。Hadoop是一个开源的分布式计算平台,由Apache...
【搭建Ubuntu版Hadoop集群详解】 在本文中,我们将详细阐述如何在Ubuntu 16.04环境下搭建Hadoop集群。Hadoop是一个开源的分布式计算框架,它允许处理和存储大量数据,尤其适合大数据分析。Ubuntu是Linux发行版中的...
本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结: 1. 安装前的准备工作:创建 hadoop 用户,设置密码,增加...
"Hadoop集群自动安装"是指通过自动化脚本或工具来快速部署和配置Hadoop环境,从而节省手动安装过程中所需的时间和精力。这样的自动化过程对于大规模的Hadoop集群尤其重要,因为它能确保一致性,减少人为错误,并提高...
首先,我们需要准备三台主机,分别为master、slaver1和slaver2,它们将在Hadoop集群中分别担任namenode、JobTracker、datanode、TaskTracker等角色。每台主机都需要设置自己的主机名和IP地址对应关系,这可以通过...
【Hadoop集群安装手册】 Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储海量数据。本手册将详细介绍如何在5台虚拟机上手动安装和配置Hadoop集群,供初学者和专业人士参考。 ### 安装...
在本文中,我们将详细探讨如何在Ubuntu 10.10 (Maverick Meerkat)上通过VMware虚拟机安装并配置Hadoop集群。这个过程涵盖了从搭建虚拟环境到安装必要的软件,以及最终配置Hadoop分布式文件系统(HDFS)和MapReduce服务...
标题 "两台 Ubuntu 机器实现 Hadoop 集群" 提到的是在两台运行 Ubuntu 操作系统的计算机上搭建 Hadoop 分布式集群的过程。Hadoop 是一个由 Apache 软件基金会开发的开源框架,主要用于存储和处理大规模数据。在 ...
2. **使用虚拟光驱安装**:使用虚拟光驱软件(例如 Daemon Tools)打开 ISO 文件,并执行里面的 `wubi.exe` 程序来在 Windows 环境下安装 Ubuntu。 3. **配置参数并重启**:根据提示配置安装参数,完成安装后需要...
在Linux环境下搭建Hadoop集群是一项复杂但至关重要的任务,它为大数据处理提供了强大的分布式平台。以下将详细介绍如何在一台虚拟机上安装多台Linux服务节点,并构建Hadoop集群环境。 首先,我们需要准备一个基础...
详细的Hadoop集群搭建过程,有6部分,前提是能连接网络,前三部都是很简单免密要仔细看,推荐JAVA版本1.8,Hadoop版本2.2.7 这两个版本都是稳定的
3. **安装rsync**:rsync是一个用于文件同步的工具,对于Hadoop集群配置非常重要。使用`sudo apt-get install rsync`命令进行安装。 4. **配置SSH免密码登录**: - 检查`.ssh`目录是否存在,如果不存在,使用`...