`
tjuximo
  • 浏览: 50597 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop学习,环境设置

 
阅读更多
参考:
http://hadoop.apache.org/common/docs/stable/single_node_setup.html

前置条件:
1)、Java运行环境,设置好JAVA_HOME
2)、安装ssh工具。

1、在http://www.apache.org/dyn/closer.cgi/hadoop/common/下载hadoop的release。下载后,解压。
2、在classpath中设置$HADOOP_HOME,并加到PATH中;
3、修改$HADOOP_HOME/conf/hadoop-env.sh,设置文件中的$JAVA_HOME

在终端运行hadoop命令,如果安装设置成功,将展示hadoop的帮助文档。


hadoop是通过xml配置的。core-site.xml用来配置common组件的属性,hdfs-site.xml勇于配置HDFS属性,mapred-site.xml文件用户配置mapreduce属性。
Hadoop运行模式有以下三种:
1、standalone或local Mode模式,
默认的设置,非分布式的的hadoop运行模式,无需运行任何守护进程,所有程序都在单JVM上执行,适合开发debug。
2、pseudo-distributed model伪分布式模式
该模式下,hadoop运行在由本机模拟的集群上。
1)配置:

core-site.xml:
<configuration>
     <property>
         <name>fs.default.name</name>
         <value>hdfs://localhost</value>
     </property>
</configuration>


hdfs-site.xml
<configuration>
     <property>
<name>dfs.replication</name>
<value>1</value>
     </property>
</configuration>


mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:8021</value>
</property>
</configuration>

2)运行$ ssh localhost命令,如果需要输密码,则运行以下命令:
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3)执行
格式化hdfs:$ hadoop namenode -format
启动hadoop: $ start-all.sh
停止hadoop: $ stop-all.sh

3、分布式集群模式 Fully-Distributed Operation
参考http://hadoop.apache.org/common/docs/stable/cluster_setup.html


3、
分享到:
评论

相关推荐

    HADOOP学习

    ### HADOOP学习知识点 #### 一、Hadoop概述与历史 - **Hadoop官方网站**:作为学习Hadoop的第一步,官方站点提供了丰富的资源和技术文档,包括最新的版本更新和技术动态等。 - **起源与发展**:Hadoop项目起源于...

    Hadoop学习资料

    Hadoop的安装环境涉及配置Hadoop的运行环境,包括Java环境、SSH免密登录设置以及Hadoop的配置文件设置等。 Hadoop分布式文件系统(HDFS)是Hadoop项目的核心子项目之一,它是一个高度容错的系统,适合在廉价硬件上...

    hadoop虚拟机环境准备

    通过本节的学习,读者可以了解Hadoop虚拟机环境的准备过程,包括虚拟机环境准备、Linux安装Hadoop、Hadoop目录结构等内容。这些知识点对于大数据和分布式处理非常重要。 知识点: * 虚拟机环境准备 + 克隆虚拟机 ...

    最新Hadoop学习笔记

    综上所述,这份“最新Hadoop学习笔记”涵盖了从环境搭建到项目实践的全过程,旨在帮助读者全面掌握Hadoop的核心技术和应用方式。通过阅读和实践,你将能够熟练地在大规模数据集上进行高效计算和存储。

    大数据+NameNode和DataNode工作机制+Hadoop的环境搭建学习

    大数据Hadoop的环境搭建学习中需要明白什么是NameNode和DataNode,以及他们的创建和使用。只有安装和创建好NameNode和DataNode,并进行测试可以打开和运行,才完成了Hadoop的环境搭建基础的一个部分,除此之外,还有...

    Hadoop学习必看路线图2.pdf

    ### Hadoop学习必看路线图概览 #### 一、Linux与Python基础 - **Linux安装及基本操作**:这是Hadoop学习的基础,包括Linux系统的安装、常用的命令行操作(如文件管理、进程管理等)。熟悉Linux环境对于后续的学习...

    大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第7期_Eclipse开发环境设置 共23页.pdf

    Hadoop集群 细细品味Hadoop_第7期_Eclipse开发环境设置,涵盖了Hadoop集群简介、Hadoop开发环境简介、Eclipse插件介绍、Hadoop工作目录简介、修改系统管理员名字等内容,为读者提供了详细的Hadoop学习指导。...

    windows环境下的hadoop3.1.0依赖,winutils

    WinUtils是Hadoop在Windows环境中的一个关键组件,它提供了与Linux上的`hadoop`命令类似的函数,如设置HADOOP_HOME环境变量、配置HDFS和MapReduce等。在安装和配置Hadoop时,我们需要将WinUtils的路径添加到系统PATH...

    Hadoop学习之路(三)Hadoop-2.7.5在CentOS-6.7上的编译

    **步骤2:** 查看`BUILDING.txt`文件,该文件详细列出了编译Hadoop所需的环境和依赖项,包括但不限于: - **Unix System**:操作系统的类型。 - **JDK 1.7+**:Java开发工具包的版本。 - **Maven 3.0 or later**...

    hadoop环境搭建教程

    在本教程中,我们将详细介绍如何在Windows系统下搭建Hadoop环境,内容涉及虚拟机的安装...对于初学者来说,按照本教程的步骤一步步操作,可以在短时间内搭建起自己的Hadoop集群环境,进而进行Hadoop相关的学习和研究。

    安装hadoop_配置hadoop的运行环境视频

    这个压缩包文件的标题和描述表明,它包含了一个视频教程,详细指导如何安装和配置Hadoop的运行环境,适合初学者进行手把手的学习。让我们深入探讨一下Hadoop的安装和配置过程中的关键知识点。 首先,我们要理解...

    hadoop学习笔记(一、hadoop集群环境搭建).docx

    基础环境设置 在开始搭建Hadoop集群前,确保所有节点的时间同步至关重要,因为Hadoop依赖于精确的时间戳进行协调。可以通过以下命令配置时间自动同步: ```bash crontab -e 0 1 * * * root /usr/sbin/ntpdate ...

    hadoop搭建与eclipse开发环境设置

    目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 具体目标是: 1.在ubuntu系统上部署hadoop 2.在windows 上能够使用eclipse连接ubuntu系统上部署的hadoop进行开发与测试 3...

    Hadoop开发环境搭建

    在Windows上搭建Hadoop环境时,需要确保`winutils.exe`的环境变量已经正确设置,否则可能会遇到权限问题或其他错误。 在“压缩包子文件的文件名称列表”中提到的“hadoop开发环境”可能包含了一系列用于搭建Hadoop...

    Hadoop入门学习文档

    ### Hadoop入门学习文档知识点梳理 #### 一、大数据概论 ##### 1.1 大数据概念 - **定义**:大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。 - **特点**: - **Volume(大量)...

    hadoop3.1环境搭建

    ### Hadoop 3.1 环境搭建详解 ...这一环境不仅可以用于测试和学习,还能作为小型数据处理任务的基础平台。随着对Hadoop理解的深入,用户还可以进一步探索更多高级特性,如完全分布式模式的部署等。

    hadoop学习资料(一)

    Hadoop学习资料(一)包含了从第一周到第十六周的课程笔记,是作者在深入学习Hadoop过程中积累的知识结晶。这份资料对于那些想要踏入大数据处理领域的初学者或者是正在提升Hadoop技能的人来说,无疑是一份宝贵的资源...

Global site tag (gtag.js) - Google Analytics