`

大数据学习笔记17:centos7 安装hadoop2.6.1 集群

 
阅读更多

centos7 安装hadoop2.6.1 集群

 

1、规划:

                  ip                            hostname            角色

                192.168.157.60        master                master

                192.168.157.61        slave1                 salve

                192.168.157.62        salve2                salve

 

2、虚拟机安装

              2.1  安装 centos  7.5 虚拟机   ,选择最小安装。

              

              2.2  安装网络工具   yum install net-tools

           

              2.3 安装 vim  yum -y  install  vim

 

3、修改为静态ip

          vi        /etc/sysconfig/network-scripts/ifcfg-ens33

          修改 :

                     BOOTPROTO=static 

                     ONBOOT=yes

          添加:

                        BOOTPROTO=static

 IPADDR=192.168.157.60

 NETMASK=255.255.255.0

 GATEWAY=192.168.157.2

 DNS1=180.76.76.76

 

4、修改主机名

                    master机器: hostname master

                     修改  /etc/sysconfig/network

                              添加:

                                         NETWORKING=yes

                                         HOSTNAME=master

                      slave待会要做同样的修改

 

5、修改hosts文件

                         vi  /etc/hosts

                        添加:

                                      192.168.157.60 master

192.168.157.61 slave1

192.168.157.62 slave2

slave机器也一样修改

 

6、关闭防-火-墙

 

                    systemctl  stop  firewalld

                    systemctl disable firewalld

                    查看:firewall-cmd --state

 

7、配置ssh免密码登录

                       ssh-keygen

                       cd  ~/.ssh

                       touch   authorized_keys

                       cat  id_rsa.pub  >  authorized_keys

           

                      在slave机器上  也执行  ssh-keygegn  

                      把公钥添加到 master的 authorized_keys

                      然后 把 authorized_keys 传到另另个机器上

 

 

8、安装jdk 1.8  配置HADOOP_HOME

         vi  ~/.bashrc 添加:

export JAVA_HOME=/usr/local/src/jdk1.8.0_172

export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib

export HADOOP_HOME=/usr/local/src/hadoop-2.6.1

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

 

 

          使生效: source  ~/.bashrc

          测试 : java -version 

 

9、配置 hadoop 2.6.1

 

      9.0 修改slaves 

                      vi  slaves:

                                           slave1

                                           slave2

                                 

       9.1 修改  hadoop-env.sh

                       export JAVA_HOME=/usr/local/src/jdk1.8.0_172

       

       9.2 修改  core-site.xml

                       

<?xml version="1.0"?>  
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>  
  
<!-- Put site-specific property overrides in this file. -->  
<configuration>  
  
<property>  
   <name>hadoop.tmp.dir</name>  
   <value>/usr/local/src/hadoop-2.6.1/tmp</value>  
</property>  
  
<property>  
   <name>fs.default.name</name>  
   <value>hdfs://192.168.157.60:9000</value>  
</property>  
  
</configuration>  

 

        

     要创建  /usr/local/src/hadoop-2.6.1/tmp  

 

   

 9.3  修改 hdfs-site.xml

      

<property>
    <name>dfs.name.dir</name>
    <value>/usr/local/src/hadoop-2.6.1/dfs/name</value>
</property>
<property>
    <name>dfs.data.dir</name>
    <value>/usr/local/src/hadoop-2.6.1/dfs/data</value>
</property>
<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>

 

 

 

    9.4 修改  mapred-site.xml 

        

<property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
</property>

 

 

 

    9.5 修改  yarn-site.xml

         

<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>
<property>
	<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
	<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
	<name>yarn.resourcemanager.address</name>
	<value>master:8032</value>
</property>
<property>
	<name>yarn.resourcemanager.scheduler.address</name>
	<value>master:8030</value>
</property>
<property>
	<name>yarn.resourcemanager.resource-tracker.address</name>
	<value>master:8035</value>
</property>
<property>
	<name>yarn.resourcemanager.admin.address</name>
	<value>master:8033</value>
</property>
<property>
	<name>yarn.resourcemanager.webapp.address</name>
	<value>master:8088</value>
</property>

 

 

      

10 、 启动集群

        格式化 hdfs   ./hdfs namenode -format

        sbin/start-all.sh

 

错误是:The authenticity of host xxx.xxx.xxx.xxx can't be established。

执行ssh  -o StrictHostKeyChecking=no  yyy.yyy.yyy.yyy,就可以了。yyy.yyy.yyy.yyy是本地机器的IP地址

 

[root@master sbin]# jps

27552 Jps

27284 ResourceManager

27144 SecondaryNameNode

 

26959 NameNode

 

 

 

分享到:
评论

相关推荐

    大数据hadoop,centos7的安装

    安装成功后,启动hdfs 格式化文件系统(仅第一次执行即可,不要重复执行):hdfs/hadoop namenode -format 启动hdfs: sbin/start-dfs.sh 验证是否启动成功: jps DataNode SecondaryNameNode NameNode ...

    基于centos的大数据hadoop集群搭建说明文档

    【标题】:基于CentOS的大数据Hadoop集群搭建详解 【描述】:本教程专为初学者设计,详细阐述了如何手动搭建Hadoop集群,步骤详尽,易于理解。 【标签】:Hadoop集群搭建 【正文】: Hadoop是一个开源的分布式...

    CentOS7下Hadoop3.2.1集群的安装与部署(下)

    在《CentOS7下Hadoop3.2.1集群的安装与部署(上)》中我们我们完成了对Hadoop集群的安装与启动。接下来,重点对HDFS和Yarn的HA配置进行介绍。 HDFS高可用 在上述Hadoop集群搭建完成之后,若要启用HA还需要对hdfs-...

    从VMware中安装CentOS到Hadoop集群+ Hive+ MySQL搭建

    适合新手,详细 01-Java环境安装 02- Eclipse下载与安装 03-VMware虚拟机的安装 04-在VMware中安装CentOS 05- Hadoop集群+ Hive+ MySQL搭建

    centos7 安装 hadoop 2.7.3集群.docx

    ### CentOS 7 下 Hadoop 2.7.3 集群安装与配置详细步骤 #### 一、配置 hosts 文件及建立 Hadoop 运行帐号 - **配置 hosts 文件**: - 打开 `/etc/hosts` 文件,并编辑添加主机名与 IP 地址的映射关系。 - 示例:...

    大数据技术基础实验报告-Linux环境下hadoop集群的搭建与基本配置.doc

    5. **安装Hadoop**:Hadoop是Apache基金会的一个开源项目,提供了分布式文件系统HDFS和MapReduce计算框架。这里安装的是Hadoop 2.7及以上版本。先上传文件到Linux,然后解压并配置环境变量,如`HADOOP_HOME`。 6. *...

    基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1.doc

    "基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1" 本文档旨在描述基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1的环境搭建过程。该文档涵盖了环境说明、软件版本说明、配置hosts和hostname、配置SSH...

    CentOS 6.8 + Hadoop2.6.0集群环境搭建

    CentOS 6.8 + Hadoop2.6.0集群环境搭建指南。

    CentOS7 Hadoop 2.7.X 安装部署.docx

    CentOS7 Hadoop 2.7.X 安装部署 本文档将指导您如何在 CentOS 7 上安装和部署 Hadoop 2.7.X。Hadoop 是一个开源的大数据处理框架,由 Apache 开发,旨在提供高效、可靠、可扩展的数据处理能力。 准备软件包 在...

    centos8安装hadoop3.3.docx

    centos8安装hadoop3.3.docx

    大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

    2. "细细品味Hadoop_Hadoop集群(第1期)_CentOS安装配置.pdf":此文件可能详细介绍了如何在CentOS操作系统上准备环境,因为Hadoop通常在Linux环境下运行,而CentOS是常用的选择。 3. "细细品味Hadoop_Hadoop集群...

    hadoop-2.6.1.tar.gz

    Hadoop是Apache软件基金会开发的一个开源分布式计算框架,它的核心设计是解决大数据处理的问题。...随着云计算和大数据技术的发展,Hadoop成为了企业级大数据处理的首选平台,因此深入学习和应用Hadoop具有很高的价值。

    VMware上CentOS7.0+Hadoop3.1伪分布式搭建

    在本教程中,我们将深入探讨如何在VMware虚拟机中安装...通过这个过程,你将不仅学会如何在VMware上的CentOS7搭建Hadoop伪分布式环境,还能深入理解Hadoop的组件和工作原理,为进一步的大数据学习打下坚实的基础。

    部署全分布模式Hadoop集群 实验报告

    部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。 2. 掌握静态 IP 地址的配置、主机名和域名映射的修改。 3. 掌握 Linux 环境下 Java 的安装、环境变量的配置、Java 基本命令的使用。 ...

    centos6.2下hadoop全分布式集群

    centos6.2下hadoop全分布式集群配置

    基于CentOS 7的Hadoop集群配置的研究与实现.docx

    【基于CentOS 7的Hadoop集群配置的研究与实现】 Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。本论文详细探讨了在CentOS 7操作系统上配置和实施Hadoop集群的过程,这对于理解和掌握大数据处理...

    非常详细的centos7.0下Hadoop2.7.1集群搭建教程

    非常详细的centos7.0下Hadoop2.7.1集群搭建教程,内附自己的解决办法和提示

    centos安装hadoop超级详细

    ### CentOS下Hadoop安装超级详细指南 #### 一、前言 随着大数据技术的发展,Hadoop作为处理海量数据的重要框架之一,在企业级应用中扮演着关键角色。本文旨在详细介绍如何在CentOS环境下安装Hadoop,包括必要的准备...

    LinuxRedHat、CentOS上搭建Hadoop集群.pdf

    搭建Hadoop集群在LinuxRedHat、CentOS上的实现 Hadoop是一种流行的开源大数据处理平台,由Google开发,现被Apache基金会维护。Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce,分别负责数据存储...

    centos安装配置hadoop超详细过程.docx

    ### CentOS安装配置Hadoop超详细过程 #### 一、Hadoop概述 Hadoop是一个由Apache基金会维护的开源分布式计算平台,...通过以上步骤,您可以在CentOS环境下成功安装和配置Hadoop集群,实现大数据的分布式存储和处理。

Global site tag (gtag.js) - Google Analytics