安装步骤:
1.规划机器
2.修改主机名称,配置ssh免登,安装jdk
3.修改配置文件,创建目录
4.启动应用
1.规划机器(centos1作为master)
规划三台机器,一种centos1作为master,其余两台机器作为slaves
10.240.139.101 centos1
10.240.140.20 centos2
10.240.139.72 centos3
centos1安装NameNode SecondNameNode ResourceManager
centos2安装DataNode NodeManager
2.修改主机名称,配置ssh免登,安装jdk
[root@centos1 bin]# vi /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=centos1
NTPSERVERARGS=iburst
[root@centos1 bin]# vi /etc/hosts
10.240.139.101 centos1
10.240.140.20 centos2
10.240.139.72 centos3
配置SSH免登,成功之后ssh localhost, ssh centos2不用用户名密码即成功。
#登录到centos1 cd ~/.ssh rm ./id_rsa* #删除之前的key ssh-keygen -t rsa #生成新的key,一直回车即可 cat ./id_rsa.pub >> ./authorized_keys scp authorized_keys root@centos2:~/.ssh/authorized_keys_from_centos1 #登录到centos2 cat authorized_keys_from_centos1 >> ./authorized_keys
关闭防火墙:
sudo service iptables stop # 关闭防火墙服务 sudo chkconfig iptables off # 禁止防火墙开机自启,就不用手动关闭了
JDK安装就滤过了。
3.修改配置文件
hadoop-env.sh:
hadoop的环境变量配置文件,需要配置JAVA_HOME的变量
yarn-env.sh:
yarn的环境配置文件,需要配置JAVA_HOME的变量
core-site.xml:
hadoop的全局默认参数配置
hdfs-site.xml:
hdfs的参数配置
yarn-site.xml:
yarn的参数配置
mapred-site.xml:
mapred的参数配置
slaves:
从节点配置
core-site.xml文件
<configuration> <property> <name>hadoop.tmp.dir</name> <value>file:/usr/local/hadoop/tmp</value> <description>Abase for other temporary directories.</description> </property> <property> <name>fs.defaultFS</name> <value>hdfs://centos1:9000</value> </property> </configuration>
hdfs-site.xml
<configuration> <property> <name>dfs.namenode.secondary.http-address</name> <value>centos1:50090</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/data</value> </property> </configuration>
slaves
centos2 centos3
yarn-site.xml
<configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>centos1</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
mapred-site.xml
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <value>centos1:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>centos1:19888</value> </property> </configuration>
创建目录:/usr/local/hadoop/tmp/dfs/name /usr/local/hadoop/tmp/dfs/data
4.启动应用
./bin/hdfs namenode -format
./sbin/start-dfs.sh centos1上可以看到NameNode SecondaryNameNode centos2,3上看到datanode
./start-yarn.sh centos1上会看到ResourceManager centos2,3上会看到NodeManager进程
查看hdfs相关:http://10.240.139.101:50090/
查看yarn相关:http://10.240.139.72:8042/node/node
相关推荐
Hadoop 集群部署操作 Hadoop 集群部署操作是指规划、安装和配置 Hadoop 集群的整个过程,以便在生产环境中运行 Hadoop 应用程序。下面是 Hadoop 集群部署操作的详细知识点: 规划 Hadoop 集群 * 规划主机名:...
"Hadoop集群部署方案" Hadoop 集群部署方案是指在分布式系统中部署 Hadoop 集群的详细步骤和配置过程。下面是该方案的详细知识点解释: 1. Hadoop 简介 Hadoop 是Apache软件基金会旗下的开源项目,主要用于大数据...
首先,我们来看任务1——Hadoop集群的部署。这一步至关重要,因为它为整个大数据处理系统提供了基础架构。在虚拟机中安装Ubuntu Kylin 16.04.4是常见的选择,因为这是一个稳定且支持Hadoop的Linux发行版。安装完成后...
本压缩包文件包含了一系列关于Hadoop集群部署、实战应用以及相关技术的详细资料,对于想要深入了解和掌握Hadoop技术的人来说,是非常宝贵的资源。 首先,我们来看《EasyHadoop集群部署文档.doc》。这份文档通常会...
### Hadoop集群部署前期准备知识点解析 #### 一、实验目的 本次实验旨在为Hadoop集群的部署做好前期准备工作,并在此基础上撰写实验报告。主要内容包括但不限于添加Hadoop用户及其权限管理、配置网络环境、禁用可能...
Hadoop集群部署知识点详解 Hadoop集群部署是大数据处理的核心组件之一,正确的部署可以确保集群的高可用性和高性能。本文将详细介绍Hadoop集群部署的各个步骤,并对关键技术点进行解析。 一、先决条件 在开始...
由于工作需要,最近一段时间开始接触学习 Hadoop 相关的东西,目前公司的实时任务和离线任务都跑在一个 Hadoop 集群,离线 任务的特点就是每天定时跑,任务跑完了资源就空闲了,为了合理的利用资源,我们打算在搭一...
Hadoop集群部署完整版 Hadoop是一款开源的大数据处理框架,主要用于存储和处理大量的数据。Hadoop集群部署是指在多台服务器上部署Hadoop,以实现高可用性、高性能和高 Scalability的大数据处理。 Hadoop简介 ...
根据给定的文件标题、描述、标签以及部分内容,本文将详细介绍如何进行Hadoop 2.4.1集群的部署步骤。对于初次接触Hadoop集群搭建的学习者来说,本指南将提供一个全面且易于理解的过程。 ### 一、准备工作 #### 1. ...
"机房Hadoop集群部署"是一个复杂的过程,涉及到硬件准备、软件安装、配置优化以及系统测试等多个环节。以下是对这一主题的详细阐述: 1. **硬件规划**:机房中的Hadoop集群通常由多台服务器组成,包括NameNode(主...
Hadoop 集群配置详解 Hadoop_Hadoop集群(第1期)_CentOS安装配置 Hadoop_Hadoop集群(第2期)_机器信息分布表 Hadoop_Hadoop集群(第4期)_SecureCRT使用 Hadoop_Hadoop集群(第5期)_Hadoop安装配置 Hadoop_Hadoop...
2.3 Hadoop 集群的测试与优化一旦集群部署完毕,进行基本的功能测试是非常重要的,如创建文件系统目录、上传数据、运行 MapReduce 示例任务等。这些操作有助于验证 Hadoop 集群的正确性和可用性。同时,根据实际需求...
部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。 2. 掌握静态 IP 地址的配置、主机名和域名映射的修改。 3. 掌握 Linux 环境下 Java 的安装、环境变量的配置、Java 基本命令的使用。 ...
### Hadoop集群部署手册知识点详解 #### 一、实验背景与目标 本次实验的主要目的是让学习者能够掌握从零开始配置Hadoop-0.21集群的方法。通过本实验,参与者不仅能了解Hadoop集群的基本组成及其工作原理,还能实际...
资源名称:云计算Hadoop:快速部署Hadoop集群内容简介: 近来云计算越来越热门了,云计算已经被看作IT业的新趋势。云计算可以粗略地定义为使用自己环境之外的某一服务提供的可伸缩计算资源,并按使用量付费。可以...
内容概要:本文档详细介绍了如何在Linux环境下配置和部署Hadoop集群。内容涵盖了连接比赛节点、修改主机名和配置、关闭防火墙、配置时间同步、安装JDK和Hadoop、配置Hadoop环境变量、格式化NameNode、启动Hadoop集群...
最近要在公司里搭建一个hadoop测试集群,于是采用docker来快速部署hadoop集群。 0. 写在前面 网上也已经有很多教程了,但是其中都有不少坑,在此记录一下自己安装的过程。 目标:使用docker搭建一个一主两从三台机器...
Hadoop 集群部署详解 Hadoop 集群部署是大数据处理和存储的关键步骤,以下是 Hadoop 集群部署的详细说明: 1. NameNode 和 JobTracker 的角色 在 Hadoop 集群中,一台机器被指定为 NameNode,另一台不同的机器被...