最近学习了下hadoop的环境变量的安装
所用版本为hadoop-0.22.0
来看步骤
Linux:ubuntu11.04
VMware Linux的安装就不说了
1.安装软件
sudo apt-get install ssh
sudo apt-get install rsync
2.jdk下载安装(这里也可以用ubuntu自己所带的jdk:/usr/lib/jvm/java-6-openjdk)
3.伪分布式模式安装(由于只有一台机器,所以只能配置伪分布模式了,即hadoop守护进程运行在本地机器上,模拟一个小规模的集群。)
core-site.xml 的配置
<?xml version="1.0"?>
<!-- core-site.xml -->
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost/</value>
</property>
</configuration>
hdfs-site.xml的配置
<?xml version="1.0"?>
<!-- hdfs-site.xml -->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
mapred-site.xml的配置
<?xml version="1.0"?>
<!-- mapred-site.xml -->
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:8021</value>
</property>
</configuration>
4.免密码ssh设置
现在确认能否不输入口令就用ssh登录localhost:
$ ssh localhost
如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
5.执行
格式化一个新的分布式文件系统:
$ bin/hadoop namenode -format
5.启动和终止守护进程
为了启动HDFS和MapReduce守护进程,需要如下指令:
[plain] view plaincopy
start-dfs.sh
start-mapred.sh
启动start-all.sh时出现如下错误:
localhost: Error: JAVA_HOME is not set.
在hadoop-0.2/conf/文件夹里有个hadoop-env.sh的文件,它的作用是配置与hadoop运行环境相关的变量,添加如下变量
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk
jobtracker在
[javascript] view plaincopy
http://localhost:50030
namenode 在
[javascript] view plaincopy
http://localhost:50070
终止守护进程也很容易,只需命令
stop-dfs.sh
分享到:
相关推荐
### Hadoop入门学习文档知识点梳理 #### 一、大数据概论 ##### 1.1 大数据概念 - **定义**:大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。 - **特点**: - **Volume(大量)...
### Hadoop 入门学习知识点概览 #### Hadoop 是什么? Hadoop 是 Apache 基金会下的一款开源软件框架,旨在通过集群的方式高效地处理大规模数据集。Hadoop 提供了分布式文件系统(HDFS)、运算资源调度系统(YARN...
本资源包是针对Hadoop入门学习的综合资料,包括了“Hadoop权威操作指南.pdf”、“Hadoop搭建操作文档(集群、伪分布式)”、“HDFS简单接口实现文档”以及“Hadoop API参考手册”和相关的Java API源码,非常适合初学...
hadoop入门学习 mapreduce求解 天气数据 2002年整年数据的最高气温
### Hadoop 入门学习资料大全 #### Hadoop 概述 Hadoop 是一个由 Apache 基金会开发的分布式系统基础架构。它允许用户无需深入了解分布式计算的底层复杂性,即可轻松地开发和运行处理大规模数据的应用程序。通过...
hadoop入门学习教程 之10.Hive工作原理和基本使用,出自《Cloudera Hadoop 4 实战课程》,hadoop入门学习教程用到技术:CDH4,Cloudera Manager,Hive,HBase,Sqoop, Hadoop培训视频教程涉及项目:电商业日志流量...
-001.Hadoop介绍.mp4 -002.VMware安装.mp4 -003.Ubuntu下载与虚拟机下安装.mp4 -004.Ubuntu常用命令.mp4 -005.Ubuntu目录和权限.mp4 -006.Ubuntu软件包桌面程序以及增强工具.mp4 -007.Ubuntu本地软件源与ISO制作.mp4...
Hadoop学习资料,通俗易懂,有需要的同志可以下载下来看看,步骤详细,自学绝对没问题
有计划的安排大数据的学习之路,可以在对Hadoop的学习规划上有一个更清晰的目标!
"Hadoop入门到精通"的学习资料旨在帮助初学者掌握这一强大的框架,并逐步晋升为专家。以下是对Hadoop及其相关概念的详细解读。 一、Hadoop概述 Hadoop是由Apache基金会开发的一个开源框架,主要用于处理和存储大...
Hadoop是一个广泛使用的分布式数据处理框架,特别适合于处理大规模数据集。它最初是作为搜索引擎的核心数据缩减功能,但由于其架构设计为...而《Hadoop入门经典书籍》这类资料,对于新手来说,是非常有价值的入门参考。
本教程《Hadoop入门教程》旨在为初学者提供全面且深入的指导,帮助他们快速理解并掌握Hadoop的基本概念、架构及应用。教程由Hadoop技术论坛在2010年出版,为当时的开发者提供了宝贵的资源。 一、Hadoop简介 Hadoop...
总的来说,《Hadoop入门实战手册》是一本全面介绍Hadoop基础知识和实践技能的书籍,对于希望进入大数据领域的学习者而言,是一份非常宝贵的资源。通过深入阅读和实践,读者能够掌握Hadoop的核心概念,从而在大数据的...
这个“Hadoop入门程序java源码”是为初学者准备的,目的是帮助他们快速掌握如何在Hadoop环境中编写和运行Java程序。Hadoop的主要组件包括HDFS(Hadoop分布式文件系统)和MapReduce,这两个部分将在下面详细介绍。 ...
通过阅读这本【Hadoop入门手册.chm】,你不仅可以了解Hadoop的基本概念,还能掌握实际操作技能,为进一步深入学习和应用Hadoop打下坚实基础。无论你是数据分析师、开发人员还是系统管理员,都能从中受益。开始你的...
《Hadoop从入门到精通》课程的PDF课件是一份全面了解和掌握Hadoop技术体系的宝贵资源。这个课程涵盖了从Hadoop的基础概念到高级应用的方方面面,旨在帮助学习者逐步提升对Hadoop的理解和实战能力。以下是根据提供的...
【Hadoop 入门】 Hadoop 是一个由Apache基金会开发的开源分布式计算框架,它以其高效、可扩展和容错性著称,是大数据处理领域的重要工具。本篇将从Hadoop的基本流程、应用开发以及集群配置和使用技巧三个方面进行...
六、Hadoop入门学习资源 - CHM手册:Hadoop的CHM手册通常包含了Hadoop的详细API文档和技术指南,是开发者了解Hadoop接口和实现原理的重要参考资料。 - PDF文件:可能包括官方文档、教程、案例研究等内容,帮助初学...