`
samwalt
  • 浏览: 285574 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

hadoop参数设置

 
阅读更多
hadoop.tmp.dir

指定的目录是本地目录,存储namenode的metadata,hdfs的块数据,还有临时数据,默认值/tmp/hadoop-${user.name}
fs.default.name

设置hadoop默认文件系统,URI的形式,需要指定namenode的主机名和端口
dfs.replication

默认是3
dfs.block.size

默认64M
dfs.data.dir

datanode的本地文件系统目录,存放hdfs块文件。如果是逗号分隔的路径列表,则每个路径下都可以保存数据,但不是像dfs.name.dir那样数据冗余。
dfs.name.dir

namenode的本地文件系统目录,存放hdfs的metadata(fsimage)。如果是逗号分隔的路径列表,那么fsimage信息在多个路径中做冗余保存
dfs.df.interval

磁盘使用统计刷新时间间隔,单位毫秒
dfs.client.block.write.retries

写数据到datanode的重试次数
dfs.heartbeat.interval

datanode心跳时间间隔,单位秒
mapred.job.tracker

jobtracker的ip地址、端口
mapred.system.dir

hdfs目录,存储共享的mapreduce系统文件

mapred.local.dir

map task中间结果存储路径,可配置多块磁盘缓解写压力

mapred.tasktracker.map.tasks.maximum

tasktracker上同时运行的map的最大数量

mapred.tasktracker.reduce.tasks.maximum

tasktracker上同时运行的reduce的最大数量


hadoop的io缓冲区大小默认4k,这个设置过于保守,通常设置成128k。
在core-site.xml文件中设置:
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>



缓存map中间结果的缓冲区大小,默认100。设置较大的值,可以减少spill的次数,即减少磁盘操作次数。如果map的瓶颈在磁盘操作,可以提高map的性能。
<property>
<name>io.sort.mb</name>
<value>200</value>
</property>

分享到:
评论

相关推荐

    hadoop平台的搭建过程简介

    2. Hadoop参数设置:Hadoop安装后,需要对其配置文件进行适当的修改来满足集群的具体需求。配置文件包括core-site.xml、hdfs-site.xml、mapred-site.xml以及yarn-site.xml。这些文件中定义了HDFS和YARN的运行参数。...

    Hadoop集群测试报告.pdf

    Hadoop参数设置** - **YARN参数**: - `yarn.nodemanager.resource.memory-mb`: 设置每个节点管理器可用的最大内存为108544MB。 - `yarn.scheduler.minimum-allocation-mb`: 应用程序请求的最小内存分配为4096MB...

    Hadoop参数调优

    Hadoop参数调优 Hadoop参数调优是指通过调整Hadoop配置文件中的各个参数来达到性能优化的目的。...Hadoop参数调优需要根据实际情况进行调整,需要考虑到集群的硬件特性和实际需求,通过实验和测试来获得最合适的设置。

    大数据运维技术第4章 Hadoop文件参数配置课件.pptx

    【大数据运维技术第4章 Hadoop文件参数配置】 在大数据领域,Hadoop是一个核心的开源框架,主要用于处理和存储大规模数据。本章主要探讨的是Hadoop的文件参数配置,这对于确保Hadoop集群的稳定运行至关重要。以下是...

    hadoop winutils hadoop.dll

    然后,通过配置Eclipse的Run/Debug Configuration,设置正确的Java运行参数,如HADOOP_HOME指向Hadoop的安装目录。 在使用winutils.exe和hadoop.dll时,可能会遇到一些常见问题,如找不到相关文件的错误、权限问题...

    hadoop配置参数

    在搭建Hadoop集群之前,了解和正确配置Hadoop的参数是至关重要的步骤。Hadoop是一个开源的分布式计算框架,主要用于处理和存储大量数据。在这个场景中,我们将关注Hadoop 2.2.0版本的伪分布式配置,这是一种在单台...

    hadoop2.6 hadoop.dll+winutils.exe

    4. 配置Hadoop的`core-site.xml`和`hdfs-site.xml`等配置文件,指定HDFS的存储路径和Hadoop的相关参数。 5. 使用`winutils.exe`初始化HDFS文件系统,如格式化Namenode。 6. 启动Hadoop服务,包括Namenode、DataNode...

    win环境 hadoop 3.1.0安装包

    编辑`yarn-site.xml`,设置YARN的相关参数,如`yarn.nodemanager.resource.memory-mb`和`yarn.scheduler.minimum-allocation-mb`,根据你的机器内存配置。 7. **配置MapReduce**: 编辑`mapred-site.xml`,创建并...

    Hadoop 三个配置文件的参数含义说明

    这些文件定义了Hadoop系统的各种参数,包括但不限于端口设置、存储策略、资源调度等。下面将详细解释这些文件中的关键参数及其作用。 1. `core-site.xml`: 这个文件包含了Hadoop的核心配置,是整个系统的全局配置...

    hadoop-3.1.3.tar.gz

    四、配置Hadoop参数 在Hadoop的配置目录($HADOOP_HOME/etc/hadoop)下,有两个主要的配置文件:core-site.xml和hdfs-site.xml。核心配置core-site.xml主要设置临时目录和HDFS的访问方式,例如: ```xml &lt;name&gt;...

    hadoop2.6.5中winutils+hadoop

    5. 配置Hadoop的配置文件,如`core-site.xml`(设置HDFS的默认FS)、`hdfs-site.xml`(配置HDFS的相关参数)等。 6. 如果需要,可以配置`mapred-site.xml`和`yarn-site.xml`以支持MapReduce和YARN。 7. 启动Hadoop...

    hadoop.dll & winutils.exe For hadoop-2.8.0

    2. **配置环境变量**:设置HADOOP_HOME、PATH等环境变量,指向Hadoop安装目录。 3. **配置hadoop.dll**:将提供的"hadoop.dll"文件放置在适当的位置,通常是%HADOOP_HOME%\bin目录下。 4. **配置winutils.exe**:将...

    hadoop组件程序包.zip

    4. 配置Hadoop:修改Hadoop配置文件,如core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml,设置相关参数,如NameNode和DataNode地址、内存大小等。 5. 初始化HDFS:执行hadoop namenode -format命令...

    hadoop2.7.x_winutils_exe&&hadoop_dll

    它提供了许多基本功能,如设置HDFS(Hadoop Distributed File System)的访问权限,启动和停止Hadoop服务,以及管理Hadoop集群。由于Hadoop最初设计时主要针对Linux环境,因此在Windows上运行Hadoop时,需要这个特殊...

    hadoop几个实例

    10. **优化技巧**:实例可能涉及到Hadoop性能优化,如设置合适的Block大小、调整MapReduce的参数,或者使用更高效的压缩算法来减少数据传输量。 总的来说,这个压缩包中的Hadoop实例将为初学者提供宝贵的实践经验,...

    hadoop插件apache-hadoop-3.1.0-winutils-master.zip

    7. **MapReduce编程**:如果你打算在Windows上进行MapReduce编程,还需要配置开发环境,包括设置Hadoop的类路径,以及使用IDE(如IntelliJ IDEA或Eclipse)的Hadoop插件。 8. **安全性与认证**:在生产环境中,你...

    hadoop-2.7.3.tar.gz 下载 hadoop tar 包下载

    在Hadoop的配置中,需要修改`core-site.xml`来定义HDFS的默认FS(文件系统),`hdfs-site.xml`来设置HDFS的相关参数,如副本数量和数据节点位置,以及`mapred-site.xml`来配置MapReduce的相关参数。此外,还需要确保...

Global site tag (gtag.js) - Google Analytics