`

Hadoop(一)之Hadoop安装的坑爹经历

 
阅读更多

 hadoop2.6.0版本搭建伪分布式环境

 

   对于我这样没有接触过hadoop的人,而且linux又只懂得皮毛,搭建好这个环境真是搞懂一个概念

   还要难,还要久,尤其特别坑爹,愤懑~

   所以,我把我在安装配置过程中的一些坑爹过程,记录下来,一为以后,可能某一天又

   要重新安装,还有点东西可以参考,毕竟自己写的,容易理解,二者,希望那些遇到跟我一样的

   问题的同仁能够尽快解决!

  

   使用的软件:

   Ubuntu  10

   JDK1.8

   Hadoop2.6

 

   我配置的环境是伪分布式的集群环境

 

  坑爹的地方:

  1. JDK的安装:

     我按照网上的朋友的文章,下载JDK,然后在/etc/profile 或者 ~/.bashrc中

     添加环境变量 和 类路径!还是用惯了windows,对于linux这种一切以文件为

    核心,刚开始接触,还真有点犯迷糊,配置环境变量都没看懂!!

   (这里我觉有一点需要注意,把jdk放在/usr ,  /home这种一般用户就可以访问得到的,如果

    你放在/opt中,那么在你测试java-version 就只能是超级用户下才能访问,而一般用户下不能访问到

export JAVA_HOME=/usr/local/jdk1.8.0_45 
export JRE_HOME=${JAVA_HOME}/jre   
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib   
export PATH=${JAVA_HOME}/bin:$PATH 

      接下来,就是java-version 看jdk是否安装好了?

     马上问题就来,不是可以执行的二进制文件!!

     怎么回事?我用echo $PATH打印出环境变量,有这个环境变量啊!

     我在网上搜,有同学说是类路径,可是我的不是这样.....

     原因是JDK是64位 还是32位的!!! 所以,下载JDK时一定要看位数!

 

   2. 关于SSH登录

     1. 无法安装SSh

     这里也是一个蛋疼的地方,因为Ubutu并没有自己装这个东西~

     所以就会

ssh: connect to host localhost port 22: Connection refused

    那么你就得自己装啊:

  // 记得我这地方卡了好久,因为当我输入下面的命令时好像不是自动提示然后安装,而是出来一长串的那种依赖,

    当时也没认真看,以为是不能安装.... 所以又在网上转圈...

    细想一下,为什么会安装不了了,因为我的虚拟机是刚装的,很多东西还没有,那些依赖按照他下面的提示进行下载

    安装就可以了.....

sudo apt-get install ssh  // 这句话是正确的没有过时

    好的,SSh总算安装好了,那么就ssh loalhost

 

    2. 登录认证失败

    恩, 下面也出来提示了,我马上回车... 可是问题又来了:

Host key verification failed.

   按照网上的做法:

sudo  /etc/ssh/ssh_config

   然后将里面的StrictHostKeyChecking 改为no 并去掉"#"

   可是这样 并不是无密码登陆,每次ssh localhost 都要重新输入密码

   还是看官网的吧...

 $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
 $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

   那么接下来,

    ssh localhost 就不要输入密码了!

   至于为什么 ,我觉得这东西还是得用,慢慢的懂得东西多了,就能够串起来了!

 

   3.hadoop 环境变量的添加:

      这地方有个坑爹的,就是我添加去了,而且也source  /etc/profile

      可是echo $PATH 就是不显示,还必须重启!!

 

  4. 关于start-dfs.shell 的启动:

      1. 配置文件 (要在Hadoop-env.sh中添加JAVA_HOME)

       Core-site.xml

      

<property>
 // 注意这里官网上的名字
 // 不是这个好像是警告 还是不正确的配置
	<name>fs.defaultFS</name> 
        <value>hdfs://localhost:9000</value>
</property>
// 注意这里是两个property 不要写到一块去了
// 我就是这样...
<property>
        <name>hadoop.tmp.dir</name>
        <value>/var/lib/hadoop</value>
</property>	

   2  start-dfs.sh的权限问题

localhost: /usr/local/hadoop-2.6.0/sbin/hadoop-daemon.sh: line 178: /usr/local/hadoop-2.6.0/logs/hadoop-kainever-datanode-Linux.out: Permission denied

    解决办法:

    // 因为权限不过 logs 是属于 root 必须改变所有者

$ /usr/local/hadoop-2.6.0$ sudo chown -hR [用户名] . //这里一个点

 

 

   3格式化文件系统

hdfs namenode -format

    我就是手贱 格式化了两次 !

    然后接下来 start-dfs.shell 运行的时候

    界面上显示的跟网上的同学的一模一样啊,可是为什么

    我用jps去查看的时候就只有一个进程了......

    想不通 !.....

    最后,还是通过网上一个朋友的提醒,去看看hadoop的日志

    就是你安装文件夹里面有一个logs的文件夹,就在那里面!

    总算找到原因了!

java.io.IOException: All directories in dfs.datanode.data.dir are invalid: "/var/lib/hadoop/dfs/data/"

    // 就是因为我格式化了两次 ,所以果断把dfs给删了,再重新格式化一次...

    然后再start-dfs.shell

    总算有四个进程了.....

    

 

     总结:

       1. 首先看官网的做法

       2. 多看看日志

       3. 记得重启

  • 大小: 25.1 KB
分享到:
评论

相关推荐

    eclipse安装Hadoop插件

    随着大数据技术的快速发展,Hadoop作为处理海量数据的重要工具之一,其应用越来越广泛。为了更好地利用Eclipse进行Hadoop程序开发,安装Hadoop Eclipse插件是十分必要的。本文将详细介绍如何在Eclipse中安装Hadoop...

    Hadoop课程实验和报告——Hadoop安装实验报告

    一、Hadoop安装 Hadoop的安装过程可以按照官方文档进行,整个过程包括了在Java JDK和JRE的安装、SSH服务的开启以及Hadoop配置文件的设置。首先,需要下载最新的稳定版本的Hadoop,然后按照官方文档进行安装和配置。...

    hadoop2 安装

    ### Hadoop 2 的安装与配置详解 #### 一、Hadoop 2 概述 Hadoop 是一个能够对大量数据进行分布式处理的软件框架,它由Apache基金会开发。Hadoop 最初的设计是为了处理海量数据的存储和计算需求,通过将大数据集...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...

    Hadoop安装使用教程0基础!!!易懂!!!

    Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程...

    hadoop的安装

    标题《hadoop的安装》所涉及的知识点涵盖Hadoop安装过程中的各个方面,包括但不限于JDK环境的配置与安装、Hadoop下载、解压、配置以及启动等步骤。以下是根据给定内容和描述生成的详细知识点: 1. JDK环境配置与...

    利用ansible 自动 安装Hadoop 集群

    在IT行业中,自动化部署是提升效率的关键之一,尤其是在大规模集群管理中。Ansible作为一个流行的开源自动化工具,被广泛用于配置管理、应用部署和任务执行。本篇将详细讲解如何利用Ansible自动安装Hadoop集群。 ...

    hadoop3.2.1 各组件安装教程

    hadoop3.2.1 各组件安装教程

    hadoop完全安装手册

    ### Hadoop完全分布式安装手册 #### 一、环境规划与准备 在进行Hadoop的完全分布式安装之前,首先需要对整个环境进行规划和必要的准备工作。根据文档提供的信息,本手册将涉及以下三个主要方面: 1. **JDK安装**...

    windows安装需要的Hadoop库文件

    在Windows上安装Hadoop需要耐心和细致的配置工作,但一旦完成,可以为学习和开发提供一个本地化的测试环境。记住,由于Windows与Linux的差异,可能会遇到一些特有的问题,需要查阅文档或社区论坛寻求解决方案。

    hadoop1.0.2 hbase0.94安装

    本教程主要涵盖的是在较旧版本的Hadoop 1.0.2上安装并配置HBase 0.94,以及相关的MapReduce开发和Hadoop-Eclipse插件的编译。这些内容对于理解大数据处理的基本流程和工具使用具有重要意义。 首先,我们来详细讨论...

    Hadoop2.7.7安装过程

    更换源的经历让学习者认识到了不同源对下载速度的影响,而安装Hadoop带来的成就感则激发了对大数据技术更深入探索的热情。 总之,安装Hadoop 2.7.7是一个既具有挑战性又富有收获的过程。通过这个实践,学习者可以为...

    hadoop集群安装笔记

    Hadoop集群安装笔记是一篇详细的安装指南,旨在帮助新手快速搭建Hadoop学习环境。以下是该笔记中的重要知识点: Hadoop集群安装目录 在安装Hadoop集群之前,需要准备好安装环境。安装环境包括Java Development Kit...

    Hadoop集群安装详细步骤

    Hadoop集群安装详细步骤 Hadoop是一个分布式计算框架,主要提供了分布式文件存储(DFS)和Map/Reduce核心功能。在这里,我们将详细介绍Hadoop集群的安装步骤,包括准备工作、安装Hadoop软件、配置集群环境等内容。 ...

    Hadoop安装教程_单机_伪分布式配置

    ### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...

    hadoop 2.8.2 3节点集群安装及native编译

    本文详细介绍了在 RHEL 6.7 操作系统上安装 Hadoop 2.8.2 三节点集群的步骤,包括集群环境准备、Hadoop 软件包的准备、JDK 的安装、集群成员 SSH 互信、NTP 的安装、Hadoop 的安装、环境变量的配置、配置文件的修改...

    单机版hadoop安装(linux)

    JDK 是 Hadoop 的依赖项之一,我们需要安装 JDK 才能安装 Hadoop。在 Ubuntu 下,我们可以使用以下命令安装 JDK: sudo apt-get install openjdk-6-jdk 在安装完成后,我们需要配置 JDK 的环境变量。在 etc/...

    windows下安装hadoop的依赖库winutils

    在Windows环境下搭建Hadoop分布式框架时,一个必不可少的步骤就是安装Hadoop的依赖库——WinUtils。这个库是Hadoop在Windows系统上运行所必需的,因为它提供了与Linux系统中`hadoop`命令类似的功能。本文将详细介绍...

    hadoop源码编译安装包及安装步骤

    在IT行业中,Hadoop是一个...总之,编译和安装Hadoop源码是一个涉及多个步骤的过程,需要耐心和细致。通过理解每个步骤的作用和原理,不仅可以更好地掌握Hadoop,还能提升你在分布式系统和大数据处理领域的专业技能。

Global site tag (gtag.js) - Google Analytics