hadoop常见配置含义备忘录 - 十万小时之旅 - ITeye博客

`

eryk

浏览: 583506 次
性别:
来自: 北京

最近访客更多访客>>

leileishizhutou

zhangzi

fhtwins

Ansel_qiang

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

maleking：太感谢了。新手搭建hadoop集群环境，dat ...
启动hadoop后没有datanodes的问题
system_mush：
NoClassDefFoundError: com/google/common/collect/Maps
di1984HIT：呵呵，我学习一下。
Katta源码分析
di1984HIT：呵呵，不管怎么说，挺好的。
zookeeper3.3学习笔记2：配置参数介绍
zoezhang：谢谢了，可以解决
maven2报cannot be cast to javax.servlet.Filter错误解决

hadoop常见配置含义备忘录

博客分类：

hadoop

阅读更多

列了很多配置的参数

其中红色的配置为必须配置参数

参数取值备注

fs.default.name	NameNode 的URI。	hdfs://主机名/
dfs.hosts/dfs.hosts.exclude	许可/拒绝DataNode列表。	如有必要，用这个文件控制许可的datanode列表。
dfs.replication	默认： 3	数据复制的分数
dfs.name.dir	举例：/home/username/hadoop/namenode 默认：`/tmp`	当这个值是一个逗号分割的目录列表时，nametable数据将会被复制到所有目录中做冗余备份。
dfs.data.dir	举例：/home/username/hadoop/datanode 默认： /tmp	当这个值是逗号分割的目录列表时，数据将被存储在所有目录下，通常分布在不同设备上。

mapred.system.dir	Map/Reduce框架存储系统文件的HDFS路径。比如/hadoop/mapred/system/ 。	这个路径是默认文件系统（HDFS）下的路径，须从服务器和客户端上均可访问。
mapred.local.dir	本地文件系统下逗号分割的路径列表，Map/Reduce临时数据存放的地方。	多路径有助于利用磁盘i/o。
mapred.tasktracker.{map\|reduce}.tasks.maximum	某一TaskTracker 上可运行的最大Map/Reduce任务数，这些任务将同时各自运行。	默认为2（2个map和2个reduce），可依据硬件情况更改。
mapred.job.tracker	JobTracker 的主机（或者IP）和端口。	主机:端口。
mapred.hosts/mapred.hosts.exclude	许可/拒绝TaskTracker列表。	如有必要，用这个文件控制许可的TaskTracker列表。

hadoop.job.history.user.location	默认：mapred.output.dir/_logs/history 也可以设置为none 来停用	作业的历史文件记录目录

conf/slaves 写入全部的slave的机器名或者IP

nameNode记住每个文件被映射成的 blockId。每个blockId对应的block会被复制到不同的机器上多余一份。

hadoop 默认的block 是 64MB

查看namenode 是否启动：http://localhost:50070/

查看jobtracker是否启动：http://localhost:50030/

分享到：

hadoop执行stop-all.sh的时候总是出现 “ ... | Hadoop为什么处理小数据量时效果不好

2010-10-25 10:42
浏览 1443
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop期末操作备忘录: 【Hadoop期末操作备忘录】是一份针对学习和使用Hadoop技术的学生或专业人士的重要参考资料。这份备忘录旨在帮助用户在期末复习阶段系统地回顾和掌握Hadoop的核心概念、关键组件以及实际操作技巧，从而在考试或项目中...

hadoop config 配置文件: Hadoop配置文件是这个系统的核心组成部分，它们定义了Hadoop集群的行为、性能和稳定性。在这个主题中，我们将深入探讨Hadoop配置文件的各个方面，以及如何有效地管理和优化它们。 1. **Hadoop配置结构** Hadoop的...

hadoop安装配置文档.pdf: Hadoop安装配置知识点：一、Hadoop简介 Hadoop是云计算的基础，它是一个分布式系统的基础架构，被广泛应用于云计算的分布式存储和计算中。Hadoop设计用来从单一服务器扩展到数千台机器，每台机器提供本地计算和...

Hadoop 2.2.0 配置文件: 在这个配置文件中，我们将会探讨Hadoop 2.2.0 在4台CentOS 6.4系统上运行所需的配置细节。首先，Hadoop的核心组件包括HDFS（Hadoop Distributed File System）和MapReduce，它们都需要通过一系列的配置文件来定制...

Hadoop3.1.3 配置文件: 首先，Hadoop的配置文件是整个系统运行的基础，它们定义了Hadoop集群的运行参数、节点间的通信方式以及数据存储策略等关键设置。主要的配置文件包括`core-site.xml`、`hdfs-site.xml`、`mapred-site.xml`和`yarn-...

hadoop单机配置方法: ### Hadoop单机配置详解在大数据处理领域，Apache Hadoop是一个开源软件框架，用于分布式存储和处理大型数据集。本文将详细介绍如何在单机环境下配置Hadoop，使其能够运行基本的大数据处理任务。 #### 一、配置...

hadoop集群配置: hadoop集群配置 Hadoop集群配置是大数据处理和存储的核心组件。它允许用户在分布式环境中存储和处理大量数据。为了正确地配置Hadoop集群，需要完成以下几个步骤： 1. 安装JDK：JDK是Hadoop的必备组件，因为Hadoop...

hadoop配置: 7. "hadoop配置.txt" - 可能是作者整理的一份Hadoop配置详解，包含了各种配置参数的含义和设置建议。综上，这个压缩包提供的资料可以帮助读者深入了解Hadoop的配置、管理和维护，尤其是对于初次接触Hadoop或需要...

Windows 7 or 10 eclipse hadoop2.7.1 配置需要文件和工具: 在Windows 7或10操作系统上配置Eclipse与Hadoop 2.7.1环境，是大数据开发过程中的一项基础任务。这个过程涉及到多个步骤，包括安装必要的软件、配置环境变量以及整合Eclipse插件，以便在集成开发环境中无缝运行...

hadoop配置文件默认配置: 本文将深入解析Hadoop的常用配置，包括HDFS（Hadoop Distributed File System）和MapReduce的端口配置，以及一些核心的默认配置参数。首先，让我们关注HDFS的端口配置： 1. **fs.default.name**: 这个参数定义了...

hadoop集群配置详解: Hadoop 集群配置是一个复杂的过程，涉及到多台服务器之间的通信和数据存储。在这个详解中，我们将深入理解如何在Fedora和Ubuntu系统上搭建一个Hadoop集群。首先，为了确保集群中的节点能够相互识别，我们需要配置...

HadoopHA集群配置文件: 本文将深入探讨Hadoop HA（高可用性）集群的配置文件，包括`core-site.xml`、`hdfs-site.xml`、`mapred-site.xml`、`yarn-site.xml`以及`slaves`文件，这些都是确保Hadoop集群稳定运行的基础。 1. `core-site.xml`:...

(完整版)hadoop常见笔试题答案.docx: 这个文档包含了Hadoop相关的常见笔试题答案，涵盖了Hadoop的基本概念、架构组件、配置文件以及操作命令等多个方面。 1. Hadoop的核心组成部分是HDFS（Hadoop Distributed File System），它是一个分布式文件系统，...

apache hadoop1.0.3配置说明 doc: 本文档用于说明hadoop1.0.3安装配置的步骤以及其中需要注意的事项

Hadoop部署和配置Kerberos安全认证: ### Hadoop部署和配置Kerberos安全认证 #### 一、Kerberos认证系统简介 Kerberos是一种网络认证协议，其设计目标是通过密钥分发中心（Key Distribution Center, KDC）来管理用户和服务之间的认证过程。Kerberos在...

Hadoop集群配置及MapReduce开发手册: 《Hadoop集群配置及MapReduce开发手册》是针对大数据处理领域的重要参考资料，主要涵盖了Hadoop分布式计算框架的安装、配置以及MapReduce编程模型的详细解析。Hadoop作为Apache基金会的一个开源项目，因其分布式存储...

Hadoop常见异常: Hadoop常见异常解决方案 Hadoop是一款大数据处理框架，但是在实际使用过程中，可能会遇到各种异常情况。本文将对Hadoop常见的异常进行总结和分析，并提供相应的解决方案。一、Cannot replicate to node 0, ...

伪分布式hadoop的配置信息: ### 伪分布式Hadoop的配置信息在深入探讨伪分布式Hadoop配置之前，我们先来了解下何为伪分布式模式。伪分布式模式是指Hadoop集群的所有守护进程运行在同一台机器上，但它们仍然通过网络（通常是在不同的端口上）...

Global site tag (gtag.js) - Google Analytics