对于我这样没有接触过hadoop的人,而且linux又只懂得皮毛,搭建好这个环境真是搞懂一个概念
还要难,还要久,尤其特别坑爹,愤懑~
所以,我把我在安装配置过程中的一些坑爹过程,记录下来,一为以后,可能某一天又
要重新安装,还有点东西可以参考,毕竟自己写的,容易理解,二者,希望那些遇到跟我一样的
问题的同仁能够尽快解决!
使用的软件:
Ubuntu 10
JDK1.8
Hadoop2.6
我配置的环境是伪分布式的集群环境
坑爹的地方:
1. JDK的安装:
我按照网上的朋友的文章,下载JDK,然后在/etc/profile 或者 ~/.bashrc中
添加环境变量 和 类路径!还是用惯了windows,对于linux这种一切以文件为
核心,刚开始接触,还真有点犯迷糊,配置环境变量都没看懂!!
(这里我觉有一点需要注意,把jdk放在/usr , /home这种一般用户就可以访问得到的,如果
你放在/opt中,那么在你测试java-version 就只能是超级用户下才能访问,而一般用户下不能访问到)
export JAVA_HOME=/usr/local/jdk1.8.0_45 export JRE_HOME=${JAVA_HOME}/jre export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib export PATH=${JAVA_HOME}/bin:$PATH
接下来,就是java-version 看jdk是否安装好了?
马上问题就来,不是可以执行的二进制文件!!
怎么回事?我用echo $PATH打印出环境变量,有这个环境变量啊!
我在网上搜,有同学说是类路径,可是我的不是这样.....
原因是JDK是64位 还是32位的!!! 所以,下载JDK时一定要看位数!!
2. 关于SSH登录
1. 无法安装SSh
这里也是一个蛋疼的地方,因为Ubutu并没有自己装这个东西~
所以就会
ssh: connect to host localhost port 22: Connection refused
那么你就得自己装啊:
// 记得我这地方卡了好久,因为当我输入下面的命令时好像不是自动提示然后安装,而是出来一长串的那种依赖,
当时也没认真看,以为是不能安装.... 所以又在网上转圈...
细想一下,为什么会安装不了了,因为我的虚拟机是刚装的,很多东西还没有,那些依赖按照他下面的提示进行下载
安装就可以了.....
sudo apt-get install ssh // 这句话是正确的没有过时
好的,SSh总算安装好了,那么就ssh loalhost
2. 登录认证失败
恩, 下面也出来提示了,我马上回车... 可是问题又来了:
Host key verification failed.
按照网上的做法:
sudo /etc/ssh/ssh_config
然后将里面的StrictHostKeyChecking 改为no 并去掉"#"
可是这样 并不是无密码登陆,每次ssh localhost 都要重新输入密码
还是看官网的吧...
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
那么接下来,
ssh localhost 就不要输入密码了!
至于为什么 ,我觉得这东西还是得用,慢慢的懂得东西多了,就能够串起来了!
3.hadoop 环境变量的添加:
这地方有个坑爹的,就是我添加去了,而且也source /etc/profile
可是echo $PATH 就是不显示,还必须重启!!
4. 关于start-dfs.shell 的启动:
1. 配置文件 (要在Hadoop-env.sh中添加JAVA_HOME)
Core-site.xml
<property> // 注意这里官网上的名字 // 不是这个好像是警告 还是不正确的配置 <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> // 注意这里是两个property 不要写到一块去了 // 我就是这样... <property> <name>hadoop.tmp.dir</name> <value>/var/lib/hadoop</value> </property>
2 start-dfs.sh的权限问题
localhost: /usr/local/hadoop-2.6.0/sbin/hadoop-daemon.sh: line 178: /usr/local/hadoop-2.6.0/logs/hadoop-kainever-datanode-Linux.out: Permission denied
解决办法:
// 因为权限不过 logs 是属于 root 必须改变所有者
$ /usr/local/hadoop-2.6.0$ sudo chown -hR [用户名] . //这里一个点
3格式化文件系统
hdfs namenode -format
我就是手贱 格式化了两次 !
然后接下来 start-dfs.shell 运行的时候
界面上显示的跟网上的同学的一模一样啊,可是为什么
我用jps去查看的时候就只有一个进程了......
想不通 !.....
最后,还是通过网上一个朋友的提醒,去看看hadoop的日志
就是你安装文件夹里面有一个logs的文件夹,就在那里面!
总算找到原因了!
java.io.IOException: All directories in dfs.datanode.data.dir are invalid: "/var/lib/hadoop/dfs/data/"
// 就是因为我格式化了两次 ,所以果断把dfs给删了,再重新格式化一次...
然后再start-dfs.shell
总算有四个进程了.....
总结:
1. 首先看官网的做法
2. 多看看日志
3. 记得重启
相关推荐
随着大数据技术的快速发展,Hadoop作为处理海量数据的重要工具之一,其应用越来越广泛。为了更好地利用Eclipse进行Hadoop程序开发,安装Hadoop Eclipse插件是十分必要的。本文将详细介绍如何在Eclipse中安装Hadoop...
一、Hadoop安装 Hadoop的安装过程可以按照官方文档进行,整个过程包括了在Java JDK和JRE的安装、SSH服务的开启以及Hadoop配置文件的设置。首先,需要下载最新的稳定版本的Hadoop,然后按照官方文档进行安装和配置。...
### Hadoop 2 的安装与配置详解 #### 一、Hadoop 2 概述 Hadoop 是一个能够对大量数据进行分布式处理的软件框架,它由Apache基金会开发。Hadoop 最初的设计是为了处理海量数据的存储和计算需求,通过将大数据集...
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程...
本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的过程。该文档不仅适用于初学者了解Hadoop的基本安装流程,对于有一定基础的技术人员来说也是一个很好的参考。 #### 二、准备工作 *...
标题《hadoop的安装》所涉及的知识点涵盖Hadoop安装过程中的各个方面,包括但不限于JDK环境的配置与安装、Hadoop下载、解压、配置以及启动等步骤。以下是根据给定内容和描述生成的详细知识点: 1. JDK环境配置与...
在IT行业中,自动化部署是提升效率的关键之一,尤其是在大规模集群管理中。Ansible作为一个流行的开源自动化工具,被广泛用于配置管理、应用部署和任务执行。本篇将详细讲解如何利用Ansible自动安装Hadoop集群。 ...
hadoop3.2.1 各组件安装教程
### Hadoop完全分布式安装手册 #### 一、环境规划与准备 在进行Hadoop的完全分布式安装之前,首先需要对整个环境进行规划和必要的准备工作。根据文档提供的信息,本手册将涉及以下三个主要方面: 1. **JDK安装**...
在Windows上安装Hadoop需要耐心和细致的配置工作,但一旦完成,可以为学习和开发提供一个本地化的测试环境。记住,由于Windows与Linux的差异,可能会遇到一些特有的问题,需要查阅文档或社区论坛寻求解决方案。
本教程主要涵盖的是在较旧版本的Hadoop 1.0.2上安装并配置HBase 0.94,以及相关的MapReduce开发和Hadoop-Eclipse插件的编译。这些内容对于理解大数据处理的基本流程和工具使用具有重要意义。 首先,我们来详细讨论...
更换源的经历让学习者认识到了不同源对下载速度的影响,而安装Hadoop带来的成就感则激发了对大数据技术更深入探索的热情。 总之,安装Hadoop 2.7.7是一个既具有挑战性又富有收获的过程。通过这个实践,学习者可以为...
Hadoop集群安装笔记是一篇详细的安装指南,旨在帮助新手快速搭建Hadoop学习环境。以下是该笔记中的重要知识点: Hadoop集群安装目录 在安装Hadoop集群之前,需要准备好安装环境。安装环境包括Java Development Kit...
Hadoop集群安装详细步骤 Hadoop是一个分布式计算框架,主要提供了分布式文件存储(DFS)和Map/Reduce核心功能。在这里,我们将详细介绍Hadoop集群的安装步骤,包括准备工作、安装Hadoop软件、配置集群环境等内容。 ...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
本文详细介绍了在 RHEL 6.7 操作系统上安装 Hadoop 2.8.2 三节点集群的步骤,包括集群环境准备、Hadoop 软件包的准备、JDK 的安装、集群成员 SSH 互信、NTP 的安装、Hadoop 的安装、环境变量的配置、配置文件的修改...
JDK 是 Hadoop 的依赖项之一,我们需要安装 JDK 才能安装 Hadoop。在 Ubuntu 下,我们可以使用以下命令安装 JDK: sudo apt-get install openjdk-6-jdk 在安装完成后,我们需要配置 JDK 的环境变量。在 etc/...
在Windows环境下搭建Hadoop分布式框架时,一个必不可少的步骤就是安装Hadoop的依赖库——WinUtils。这个库是Hadoop在Windows系统上运行所必需的,因为它提供了与Linux系统中`hadoop`命令类似的功能。本文将详细介绍...
在IT行业中,Hadoop是一个...总之,编译和安装Hadoop源码是一个涉及多个步骤的过程,需要耐心和细致。通过理解每个步骤的作用和原理,不仅可以更好地掌握Hadoop,还能提升你在分布式系统和大数据处理领域的专业技能。