`

Hadoop 参数

 
阅读更多

转发自:http://www.cnblogs.com/ggjucheng/archive/2012/04/17/2454590.html

hadoop集群默认配置和常用配置

获取默认配置

配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,有两个方法:
1.选择相应版本的hadoop,下载解压后,搜索*.xml,找到core-default.xml,hdfs-default.xml,mapred-default.xml,这些就是默认配置,可以参考这些配置的说明和key,配置hadoop集群。
2.浏览apache官网,三个配置文件链接如下:
   http://hadoop.apache.org/common/docs/current/core-default.html
   http://hadoop.apache.org/common/docs/current/hdfs-default.html
   http://hadoop.apache.org/common/docs/current/mapred-default.html
   这里是浏览hadoop当前版本号的默认配置文件,其他版本号,要另外去官网找。
其中第一个方法找到默认的配置是最好的,因为每个属性都有说明,可以直接使用。
另外,core-site.xml是全局配置,hdfs-site.xml和mapred-site.xml分别是hdfs和mapred的局部配置。

常用的端口配置

HDFS端口

参数 描述 默认 配置文件 例子值
fs.default.name namenode RPC交互端口 8020 core-site.xml hdfs://master:8020/
dfs.http.address  NameNode web管理端口 50070  hdfs-site.xml  0.0.0.0:50070
dfs.datanode.address datanode 控制端口 50010  hdfs-site.xml  0.0.0.0:50010
dfs.datanode.ipc.address datanode的RPC服务器地址和端口  50020 hdfs-site.xml 0.0.0.0:50020
dfs.datanode.http.address datanode的HTTP服务器和端口  50075 hdfs-site.xml  0.0.0.0:50075


                                         
                     
                   
                   
             

MR端口

参数 描述 默认  配置文件 例子值
mapred.job.tracker job tracker交互端口  8021 mapred-site.xml hdfs://master:8021/
mapred.job.tracker.http.address job tracker的web管理端口 50030 mapred-site.xml  0.0.0.0:50030
mapred.task.tracker.http.address task tracker的HTTP端口 50060 mapred-site.xml 0.0.0.0:50060


                                            
                    
         

其他端口

参数 描述  默认  配置文件 例子值
dfs.secondary.http.address  secondary NameNode web管理端口  50090 hdfs-site.xml 0.0.0.0:28680


                                        

集群目录配置

参数 描述  默认  配置文件 例子值
dfs.name.dir name node的元数据,以,号隔开,hdfs会把元数据冗余复制到这些目录,一般这些目录是不同的块设备,不存在的目录会被忽略掉

{hadoop.tmp.dir}

/dfs/name

hdfs-site.xm /hadoop/hdfs/name
dfs.name.edits.dir  node node的事务文件存储的目录,以,号隔开,hdfs会把事务文件冗余复制到这些目录,一般这些目录是不同的块设备,不存在的目录会被忽略掉  ${dfs.name.dir} hdfs-site.xm ${dfs.name.dir}
 fs.checkpoint.dir secondary NameNode的元数据以,号隔开,hdfs会把元数据冗余复制到这些目录,一般这些目录是不同的块设备,不存在的目录会被忽略掉

${hadoop.tmp.dir}

/dfs/namesecondary

core-site.xml /hadoop/hdfs/namesecondary
 fs.checkpoint.edits.dir secondary NameNode的事务文件存储的目录,以,号隔开,hdfs会把事务文件冗余复制到这些目录 ${fs.checkpoint.dir} core-site.xml ${fs.checkpoint.dir}
hadoop.tmp.dir 临时目录,其他临时目录的父目录 /tmp/hadoop-${user.name} core-site.xml /hadoop/tmp/hadoop-${user.name}
dfs.data.dir data node的数据目录,以,号隔开,hdfs会把数据存在这些目录下,一般这些目录是不同的块设备,不存在的目录会被忽略掉

${hadoop.tmp.dir}

/dfs/data

hdfs-site.xm

/hadoop/hdfs/data1/data,

/hadoop/hdfs/data2/data

mapred.local.dir MapReduce产生的中间数据存放目录,以,号隔开,hdfs会把数据存在这些目录下,一般这些目录是不同的块设备,不存在的目录会被忽略掉

${hadoop.tmp.dir}

/mapred/local

mapred-site.xml

/hadoop/hdfs/data1/mapred/local,

/hadoop/hdfs/data2/mapred/local

mapred.system.dir MapReduce的控制文件

${hadoop.tmp.dir}

/mapred/system

mapred-site.xml /hadoop/hdfs/data1/system

 

其他配置

参数 描述  默认  配置文件 例子值
dfs.support.append  支持文件append,主要是支持hbase  false hdfs-site.xml true
dfs.replication  文件复制的副本数,如果创建时不指定这个参数,就使用这个默认值作为复制的副本数  3 hdfs-site.xml 2

分享到:
评论

相关推荐

    Hadoop参数调优

    Hadoop参数调优 Hadoop参数调优是指通过调整Hadoop配置文件中的各个参数来达到性能优化的目的。Hadoop配置文件中包含了大量的参数,每个参数都有其特定的作用和默认值。通过调整这些参数,可以大大提高Hadoop的性能...

    hadoop调优参数列表.

    hadoop调优参数列表.hadoop调优参数列表.hadoop调优参数列表.

    hadoop 参数配置

    hadoop参数配置手册,包含hadoop2.6.0详细参数,需要的可以下载了解一下

    hadoop调优参数列表.xlsx

    hadoop调优参数列表

    Hadoop 参数配置优化.docx

    在Hadoop生态系统中,参数配置优化对于提升系统性能和稳定性至关重要。以下是一些关键的Hadoop配置参数及其详细解释: 1. **hadoop.tmp.dir**: 默认值为`/tmp`,应手动配置为一个专门的目录,尤其是当服务器有多...

    hadoop-3.1.3.tar.gz

    四、配置Hadoop参数 在Hadoop的配置目录($HADOOP_HOME/etc/hadoop)下,有两个主要的配置文件:core-site.xml和hdfs-site.xml。核心配置core-site.xml主要设置临时目录和HDFS的访问方式,例如: ```xml <name>...

    第4章 Hadoop文件参数配置.docx

    在深入探讨Hadoop文件参数配置之前,我们首先要理解Hadoop的核心概念。Hadoop是一个开源的分布式计算框架,它允许在大规模集群中存储和处理大量数据。...记住,正确配置Hadoop参数是实现高可用性和性能优化的基础。

    hadoop实验+作业.zip

    4. 性能优化:实验可能包括如何调整Hadoop参数以优化性能,如修改Map和Reduce的任务数量,设置内存大小等。 三、Hadoop作业 作业通常涉及解决特定的问题或实现特定的功能,可能涵盖以下内容: 1. 数据分析:使用...

    Spark+Hadoop+IDE环境搭建

    3. **使用Spark的Hadoop兼容模式**:Spark可以以Hadoop客户端模式运行,通过`spark.hadoop`前缀配置Hadoop参数。 **在IDE中开发和运行Spark应用:** 1. **选择IDE**:可以选择IntelliJ IDEA、Eclipse等支持Scala或...

    实战hadoop源代码

    5. **容错与性能优化**:书中会涵盖如何处理节点故障,以及如何通过调整Hadoop参数来优化集群性能。 6. **Hadoop与其他组件集成**:Hadoop通常与其他大数据工具如Hive、Pig、Spark等配合使用,源代码可能包含这些...

    IT面试-Hadoop总结-云计算

    三、Hadoop参数调优 1. JVM参数调优:JVM(Java Virtual Machine)是Hadoop的运行环境,可以通过调整JVM参数来提高Hadoop的性能。 2. Map/Reduce Slots调优:Map/Reduce Slots是Hadoop中的并发度参数,通过调整这个...

    eclipse的hadoop2.7插件以及hadoop-common编译文件

    在这里,你可以编写Map和Reduce函数,设置输入和输出路径,以及配置其他的Hadoop参数。Eclipse会自动处理作业的编译和打包,生成可执行的JAR文件。 对于Spark集成,虽然标题中没有明确提及,但通常Eclipse中也有...

    第4章 Hadoop文件参数配置.pdf

    Hadoop 文件参数配置 Hadoop 文件参数配置是 Hadoop 集群的关键组件,负责存储和管理大规模数据。为了确保 Hadoop 集群的稳定运行,需要对 Hadoop 文件参数进行正确的配置。本章节将指导读者如何配置 Hadoop 文件...

    Hadoop开发者入门-带书签文字版

    5. **Hadoop安装与配置**:从安装Java环境到搭建Hadoop集群,再到配置Hadoop参数,这些实践步骤是每个开发者都需要掌握的。 6. **数据输入与输出**:学习如何使用Hadoop的InputFormat和OutputFormat,以及...

    hadoop平台的搭建过程简介

    2. Hadoop参数设置:Hadoop安装后,需要对其配置文件进行适当的修改来满足集群的具体需求。配置文件包括core-site.xml、hdfs-site.xml、mapred-site.xml以及yarn-site.xml。这些文件中定义了HDFS和YARN的运行参数。...

    hadoop课程设计

    8. **性能优化**:研究如何通过调整Hadoop参数来提高数据处理速度,如增大MapReduce的槽位数量、优化数据块大小等。 9. **故障排查与维护**:学习如何监控Hadoop集群的运行状态,识别和解决常见的运行问题,确保...

Global site tag (gtag.js) - Google Analytics