网上找到一兄弟的资源,debian下安装hadoop,附件中
1.下载hadoop-0.20.205.0.tar.gz
2.cp 到/usr/local/hadoop并减压
3.修改环境变量
root@debian:/usr/local/hadoop/conf# echo $JAVA_HOME
/opt/software/hadoop/jdk1.6.0_27
vim /usr/local/hadoop/conf/hadoop-env.sh
export JAVA_HOME=/opt/software/hadoop/jdk1.6.0_27
保存
root@debian:/usr/local/hadoop/bin# vim /etc/profile
添加hadoop安装目录及PATH添加bin目录
4./croot@debian:/usr/local/hadoop/conf# vim core-site.xml
6 <configuration>
7 <property>
8 <name>fs.default.name</name>
9 <value>hdfs://localhost:9000</value>
10 </property>
11 <property>
12 <name>dfs.replication</name>
13 <value>1</value>
14 </property>
15 <property>
16 <name>hadoop.tmp.dir</name>
17 <value>/home/hadoop/tmp</value>
18 </property>
19 </configuration>
5./croot@debian:/usr/local/hadoop/conf# vim mapred-site.xml
<configuration>
7 <property>
8 <name>mapred.job.tracker</name>
9 <value>localhost:9001</value>
10 </property>
11 </configuration>
6.报如下错误:
localhost: Unrecognized option: -jvm
localhost: Could not create the Java virtual machine.
解决办法:root@debian:/usr/local/hadoop/bin# vim hadoop
修改为如下(把-jvm去掉):
253 if [[ $EUID -eq 0 ]]; then
254 #HADOOP_OPTS="$HADOOP_OPTS -jvm server $HADOOP_DATANODE_OPTS"
255 HADOOP_OPTS="$HADOOP_OPTS -server $HADOOP_DATANODE_OPTS"
256 else
257 HADOOP_OPTS="$HADOOP_OPTS -server $HADOOP_DATANODE_OPTS"
258 fi
7.root@debian:/usr/local/hadoop/bin# ./hadoop namenode -format
8.root@debian:/usr/local/hadoop/bin# ./start-all.sh
9.关于 Warning: $HADOOP_HOME is deprecated
A.把上面配置的HADOOP_HOME环境变量去掉
B.vim /root/.bashrc添加export HADOOP_HOME_WARN_SUPPRESS=1
告警消失
10.ssh无密码登录配置
# cd ~/.ssh (进入用户目录下的隐藏文件.ssh)
# ssh-keygen -t rsa (用rsa生成密钥)
# cp id_rsa.pub authorized_keys (把公钥复制一份,并改名为authorized_keys,这步执行完,应该ssh localhost可以无密码登录本机了,可能第一次要密码)
# chmod 600 authorized_keys
# ssh localhost 验证
11.解决"no datanode to stop"问题
原因:每次namenode format会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有清空datanode下的数据,导致启动时失败,所要做的就是每次fotmat前,清空tmp一下的所有目录
第一种解决方案:
删除rm -r /home/hadoop/tmp
创建mkdir /home/hadoop/tmp
重新格式化:hadoop namenode -format
第二种解决方案:
修改使的每个Slave的namespaceID使其与Master的namespaceID一致
该"namespaceID"位于"/home/hadoop/tmp/dfs/data/current/VERSION"文件中
12.Namenode in safe mode
hadoop dfsadmin -safemode leave
分享到:
相关推荐
Hadoop课程实验和报告——Hadoop安装实验报告 Hadoop是一个开源的大数据处理框架,由Apache基金会开发和维护。它提供了一种可靠、可扩展、可高效的方法来存储和处理大规模数据。在本实验报告中,我们将介绍Hadoop的...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...
《Hadoop安装部署详解》 Hadoop,作为Google文件系统(GFS)的开源实现,是分布式计算领域的重要工具,其强大的数据处理能力和高容错性吸引了众多开发者和企业的关注。本文将详细介绍如何在Linux环境下安装和部署...
Hadoop 安装 学习 入门教程 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, ...
Hadoop安装部署手册是针对初学者的全面指南,旨在帮助用户了解和实践Hadoop的安装与运行。Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储大规模数据集。以下是详细的步骤和关键知识点:...
### Hadoop安装与配置详解 #### 一、概述 Hadoop是一个开源软件框架,用于分布式存储和处理大数据集。它能够高效地处理PB级别的数据,适用于海量数据的存储和计算场景。本文将详细介绍如何在多台虚拟机上安装和...
### Hadoop安装过程详解 #### 一、概述 Hadoop是一种能够处理大量数据的大规模分布式存储与计算框架,常用于构建大数据分析平台。本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的...
### Hadoop 安装详细指南 #### 一、概述 Hadoop是一款开源软件框架,用于分布式存储和处理大型数据集。本文档详细介绍了如何在CentOS 7环境下部署Hadoop 2.7.3的完全分布式环境。此教程适合希望在多台服务器之间...
### Hadoop安装与配置详解 #### 一、前言 Hadoop是一款开源软件框架,用于分布式存储和处理大型数据集。本文将详细介绍如何在CentOS 5.5环境下搭建一个包含1个NameNode节点和2个DataNode节点的Hadoop集群,并通过一...
Hadoop安装-保你一次成功
【Hadoop安装教程_伪分布式配置_CentOS6.4】 Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储大规模数据。本教程针对的是在CentOS 6.4操作系统上安装Hadoop 2.6.0的伪分布式配置,这种...
三、Hadoop安装与部署 1. 环境准备:确保具备多台Linux服务器,安装Java环境,配置SSH无密码登录。 2. 下载Hadoop:从Apache官方网站获取最新稳定版本的Hadoop,解压到服务器。 3. 配置环境变量:在`~/.bashrc`或`~/...
Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程...
hadoop安装和配置,这份PPT讲诉了如何安装和配置Hadoop
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
二、Hadoop安装 1. 环境准备:确保系统为Linux环境,因为Hadoop通常在Linux服务器上运行。同时,需要安装Java环境,因为Hadoop依赖Java运行。 2. 下载Hadoop:访问Apache官方网站下载最新稳定版的Hadoop二进制包。 3...