centos7 安装hadoop2.6.1 集群
1、规划:
ip hostname 角色
192.168.157.60 master master
192.168.157.61 slave1 salve
192.168.157.62 salve2 salve
2、虚拟机安装
2.1 安装 centos 7.5 虚拟机 ,选择最小安装。
2.2 安装网络工具 yum install net-tools
2.3 安装 vim yum -y install vim
3、修改为静态ip
vi /etc/sysconfig/network-scripts/ifcfg-ens33
修改 :
BOOTPROTO=static
ONBOOT=yes
添加:
BOOTPROTO=static
IPADDR=192.168.157.60
NETMASK=255.255.255.0
GATEWAY=192.168.157.2
DNS1=180.76.76.76
4、修改主机名
master机器: hostname master
修改 /etc/sysconfig/network
添加:
NETWORKING=yes
HOSTNAME=master
slave待会要做同样的修改
5、修改hosts文件
vi /etc/hosts
添加:
192.168.157.60 master
192.168.157.61 slave1
192.168.157.62 slave2
slave机器也一样修改
6、关闭防-火-墙
systemctl stop firewalld
systemctl disable firewalld
查看:firewall-cmd --state
7、配置ssh免密码登录
ssh-keygen
cd ~/.ssh
touch authorized_keys
cat id_rsa.pub > authorized_keys
在slave机器上 也执行 ssh-keygegn
把公钥添加到 master的 authorized_keys
然后 把 authorized_keys 传到另另个机器上
8、安装jdk 1.8 配置HADOOP_HOME
vi ~/.bashrc 添加:
export JAVA_HOME=/usr/local/src/jdk1.8.0_172
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib
export HADOOP_HOME=/usr/local/src/hadoop-2.6.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
使生效: source ~/.bashrc
测试 : java -version
9、配置 hadoop 2.6.1
9.0 修改slaves
vi slaves:
slave1
slave2
9.1 修改 hadoop-env.sh
export JAVA_HOME=/usr/local/src/jdk1.8.0_172
9.2 修改 core-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/src/hadoop-2.6.1/tmp</value> </property> <property> <name>fs.default.name</name> <value>hdfs://192.168.157.60:9000</value> </property> </configuration>
要创建 /usr/local/src/hadoop-2.6.1/tmp
9.3 修改 hdfs-site.xml
<property> <name>dfs.name.dir</name> <value>/usr/local/src/hadoop-2.6.1/dfs/name</value> </property> <property> <name>dfs.data.dir</name> <value>/usr/local/src/hadoop-2.6.1/dfs/data</value> </property> <property> <name>dfs.replication</name> <value>2</value> </property>
9.4 修改 mapred-site.xml
<property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>
9.5 修改 yarn-site.xml
<property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>master:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>master:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>master:8035</value> </property> <property> <name>yarn.resourcemanager.admin.address</name> <value>master:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>master:8088</value> </property>
10 、 启动集群
格式化 hdfs ./hdfs namenode -format
sbin/start-all.sh
错误是:The authenticity of host xxx.xxx.xxx.xxx can't be established。
执行ssh -o StrictHostKeyChecking=no yyy.yyy.yyy.yyy,就可以了。yyy.yyy.yyy.yyy是本地机器的IP地址
[root@master sbin]# jps
27552 Jps
27284 ResourceManager
27144 SecondaryNameNode
26959 NameNode
相关推荐
安装成功后,启动hdfs 格式化文件系统(仅第一次执行即可,不要重复执行):hdfs/hadoop namenode -format 启动hdfs: sbin/start-dfs.sh 验证是否启动成功: jps DataNode SecondaryNameNode NameNode ...
【标题】:基于CentOS的大数据Hadoop集群搭建详解 【描述】:本教程专为初学者设计,详细阐述了如何手动搭建Hadoop集群,步骤详尽,易于理解。 【标签】:Hadoop集群搭建 【正文】: Hadoop是一个开源的分布式...
在《CentOS7下Hadoop3.2.1集群的安装与部署(上)》中我们我们完成了对Hadoop集群的安装与启动。接下来,重点对HDFS和Yarn的HA配置进行介绍。 HDFS高可用 在上述Hadoop集群搭建完成之后,若要启用HA还需要对hdfs-...
适合新手,详细 01-Java环境安装 02- Eclipse下载与安装 03-VMware虚拟机的安装 04-在VMware中安装CentOS 05- Hadoop集群+ Hive+ MySQL搭建
### CentOS 7 下 Hadoop 2.7.3 集群安装与配置详细步骤 #### 一、配置 hosts 文件及建立 Hadoop 运行帐号 - **配置 hosts 文件**: - 打开 `/etc/hosts` 文件,并编辑添加主机名与 IP 地址的映射关系。 - 示例:...
5. **安装Hadoop**:Hadoop是Apache基金会的一个开源项目,提供了分布式文件系统HDFS和MapReduce计算框架。这里安装的是Hadoop 2.7及以上版本。先上传文件到Linux,然后解压并配置环境变量,如`HADOOP_HOME`。 6. *...
"基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1" 本文档旨在描述基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1的环境搭建过程。该文档涵盖了环境说明、软件版本说明、配置hosts和hostname、配置SSH...
CentOS 6.8 + Hadoop2.6.0集群环境搭建指南。
CentOS7 Hadoop 2.7.X 安装部署 本文档将指导您如何在 CentOS 7 上安装和部署 Hadoop 2.7.X。Hadoop 是一个开源的大数据处理框架,由 Apache 开发,旨在提供高效、可靠、可扩展的数据处理能力。 准备软件包 在...
centos8安装hadoop3.3.docx
2. "细细品味Hadoop_Hadoop集群(第1期)_CentOS安装配置.pdf":此文件可能详细介绍了如何在CentOS操作系统上准备环境,因为Hadoop通常在Linux环境下运行,而CentOS是常用的选择。 3. "细细品味Hadoop_Hadoop集群...
部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。 2. 掌握静态 IP 地址的配置、主机名和域名映射的修改。 3. 掌握 Linux 环境下 Java 的安装、环境变量的配置、Java 基本命令的使用。 ...
Hadoop是Apache软件基金会开发的一个开源分布式计算框架,它的核心设计是解决大数据处理的问题。...随着云计算和大数据技术的发展,Hadoop成为了企业级大数据处理的首选平台,因此深入学习和应用Hadoop具有很高的价值。
在本教程中,我们将深入探讨如何在VMware虚拟机中安装...通过这个过程,你将不仅学会如何在VMware上的CentOS7搭建Hadoop伪分布式环境,还能深入理解Hadoop的组件和工作原理,为进一步的大数据学习打下坚实的基础。
centos6.2下hadoop全分布式集群配置
【基于CentOS 7的Hadoop集群配置的研究与实现】 Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。本论文详细探讨了在CentOS 7操作系统上配置和实施Hadoop集群的过程,这对于理解和掌握大数据处理...
非常详细的centos7.0下Hadoop2.7.1集群搭建教程,内附自己的解决办法和提示
### CentOS下Hadoop安装超级详细指南 #### 一、前言 随着大数据技术的发展,Hadoop作为处理海量数据的重要框架之一,在企业级应用中扮演着关键角色。本文旨在详细介绍如何在CentOS环境下安装Hadoop,包括必要的准备...
搭建Hadoop集群在LinuxRedHat、CentOS上的实现 Hadoop是一种流行的开源大数据处理平台,由Google开发,现被Apache基金会维护。Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce,分别负责数据存储...
### CentOS安装配置Hadoop超详细过程 #### 一、Hadoop概述 Hadoop是一个由Apache基金会维护的开源分布式计算平台,...通过以上步骤,您可以在CentOS环境下成功安装和配置Hadoop集群,实现大数据的分布式存储和处理。