`

hadoop常见配置含义

阅读更多

参数                            取值                                         备注

fs.default.name NameNode 的URI。 hdfs://主机名/
dfs.hosts/dfs.hosts.exclude 许可/拒绝DataNode列表。 如有必要,用这个文件控制许可的datanode列表。
dfs.replication 默认: 3 数据复制的分数
dfs.name.dir

举例:/home/username/hadoop/namenode

默认:/tmp

当这个值是一个逗号分割的目录列表时,nametable数据将会被复制到所有目录中做冗余备份。
dfs.data.dir

举例:/home/username/hadoop/datanode

默认: /tmp

当这个值是逗号分割的目录列表时,数据将被存储在所有目录下,通常分布在不同设备上。
     
mapred.system.dir Map/Reduce框架存储系统文件的HDFS路径。比如/hadoop/mapred/system/ 。 这个路径是默认文件系统(HDFS)下的路径, 须从服务器和客户端上均可访问。
mapred.local.dir 本地文件系统下逗号分割的路径列表,Map/Reduce临时数据存放的地方。 多路径有助于利用磁盘i/o。
mapred.tasktracker.{map|reduce}.tasks.maximum 某一TaskTracker 上可运行的最大Map/Reduce任务数,这些任务将同时各自运行。 默认为2(2个map和2个reduce),可依据硬件情况更改。
mapred.job.tracker JobTracker 的主机(或者IP)和端口。 主机:端口 。
mapred.hosts/mapred.hosts.exclude 许可/拒绝TaskTracker列表。 如有必要,用这个文件控制许可的TaskTracker列表。
     
hadoop.job.history.user.location

默认:mapred.output.dir/_logs/history

也可以设置为none 来停用

作业的历史文件记录目录

 

conf/slaves 写入全部的slave的机器名或者IP

 

nameNode记住每个文件被映射成的 blockId。每个blockId对应的block会被复制到不同的机器上多余一份。

hadoop 默认的block 是 64MB

 

在M/R优化的时候可以通过修改一些配置文件的值来提高性能

0
2
分享到:
评论

相关推荐

    hadoop安装配置文档.pdf

    Hadoop安装配置知识点: 一、Hadoop简介 Hadoop是云计算的基础,它是一个分布式系统的基础架构,被广泛应用于云计算的分布式存储和计算中。Hadoop设计用来从单一服务器扩展到数千台机器,每台机器提供本地计算和...

    Hadoop使用常见问题以及解决方法

    启动 datanode 失败是 Hadoop 中的常见问题,主要是由于 NameNode 和 DataNode 的配置不正确。解决方法是删除 NameNode 和 DataNode 的文件系统路径,然后重新格式化分布式文件系统。 java.io.IOException: Could ...

    (完整版)hadoop常见笔试题答案.docx

    这个文档包含了Hadoop相关的常见笔试题答案,涵盖了Hadoop的基本概念、架构组件、配置文件以及操作命令等多个方面。 1. Hadoop的核心组成部分是HDFS(Hadoop Distributed File System),它是一个分布式文件系统,...

    Hadoop配置文件表(如需要请下载附件)

    博客中可能提供的“Hadoop配置查询.xls”是一个Excel表格,可能列出了所有常见的配置参数、其默认值、用途以及最佳实践。这样的资源对于开发者和管理员来说非常宝贵,可以帮助他们快速查找和调整配置,以适应不同的...

    hadoop配置

    本文将深入探讨Hadoop的配置过程,包括核心组件的配置、集群搭建以及常见问题的调试。 一、Hadoop配置基础 1. **环境准备**:首先,你需要在Linux环境下安装Java开发环境,因为Hadoop是基于Java的。通常,我们需要...

    hadoop常见问题及解决方法

    hadoop常见问题及解决方法 Hadoop是大数据处理的重要工具,但是在安装和使用Hadoop时,可能会出现一些常见的问题,这些问题可能会导致Hadoop无法正常工作,或者无法达到预期的性能。下面是Hadoop常见的问题及解决...

    hadoop2.6基于yarn的安装配置

    Hadoop 2.6 基于 YARN 的安装配置 Hadoop 2.6 是一个基于 YARN(Yet Another Resource Negotiator)的分布式计算框架,它提供了高效、可靠的数据处理能力。在本文中,我们将详细介绍 Hadoop 2.6 的安装配置过程,...

    windows下Hadoop配置

    Windows 下 Hadoop 配置详解 在本文中,我们将详细介绍 Windows 下 Hadoop 配置的过程。Hadoop 是一款开源的分布式...本文详细介绍了 Windows 下 Hadoop 配置的过程和常见问题,旨在帮助读者更好地理解和配置 Hadoop。

    Hadoop 0.20.1 配置手册-高清pdf文字版

    《Hadoop 0.20.1 配置手册》是一本针对Hadoop早期版本0.20.1的详细配置指南,对于理解和操作Hadoop集群具有重要价值。Hadoop作为一个开源的大数据处理框架,其核心组件包括HDFS(分布式文件系统)和MapReduce(并行...

    单机版hadoop配置文件

    在配置过程中,可能遇到的常见问题包括端口冲突、权限问题、路径不正确等,解决这些问题通常需要仔细检查日志并对照官方文档进行调整。对于初学者,理解这些配置的意义以及它们如何影响Hadoop的运行是非常重要的学习...

    史上最全的Hadoop配置完全手册

    常见的 Hadoop 配置文件包括 `hadoop-env.sh`、`core-site.xml`、`hdfs-site.xml`、`mapred-site.xml` 和 `yarn-site.xml`。 Hadoop 分布式文件系统 (HDFS) HDFS 是 Hadoop 的主要存储层,提供廉价、可靠的存储...

    hadoop安装配置共51页.pdf.zip

    【标题】:“Hadoop安装配置共51页.pdf”是一个关于Hadoop分布式文件系统安装与配置的详细教程,涵盖了从环境准备到集群搭建的全过程。Hadoop是Apache软件基金会的一个开源项目,它为大规模数据处理提供了可靠、可...

    hadoop-window环境配置.txt

    ### Hadoop在Windows环境下的配置知识点详解 #### 一、Hadoop简介 Hadoop是一个能够对大量数据进行分布式处理的软件框架,它为用户提供了高可靠性、高效性、可扩展性的数据处理能力。Hadoop的核心组件包括HDFS...

    Eclipse+Hadoop环境配置

    本文将详细介绍如何在Eclipse中配置Hadoop开发环境,包括所需的基本软件配置、具体步骤以及常见问题的解决方法。 #### 二、基本配置信息 - **操作系统**:Ubuntu 10.04 - **Hadoop版本**:0.20.2 - **Eclipse版本**...

    Hadoop的安装部署与配置实验 共11页.pdf

    Hadoop 安装部署与配置实验 Hadoop 是一个基于 Java 的大数据处理框架,由 Apache 基金会开发和维护。该框架提供了一个分布式计算环境,能够处理大量数据。下面是 Hadoop 的安装部署与配置实验总结。 一、实验环境...

    hadoop安装配置详解

    以下是对"Hadoop安装配置详解"的详细阐述: ### 1. 虚拟机安装 在进行Hadoop安装前,首先需要准备一个虚拟机环境。通常选择如VMware或VirtualBox等虚拟机软件。为了便于管理和扩展,建议采用Linux操作系统,如...

    linux下的hadoop安装及配置详解

    ### Linux 下 Hadoop 安装及配置详解 #### 前言 随着大数据技术的不断发展,Hadoop 成为了处理大规模数据集的一种重要工具。本文旨在详细介绍如何在 Linux 环境下安装和配置 Hadoop,确保能够顺利地进行大数据处理...

    hadoop 安装配置教程.md

    - 使用`jps`命令检查Hadoop守护进程是否启动,常见的进程包括`NameNode`、`DataNode`、`ResourceManager`、`NodeManager`等。 #### 八、其他注意事项 - 修改主机名以区分不同的节点,可以通过编辑`/etc/hostname`...

    Hadoop安装教程_单机_伪分布式配置

    ### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...

Global site tag (gtag.js) - Google Analytics