Hadoop关于最大map reducer数目 - 半睡半醒半浮生 - ITeye博客

`

Genie13

浏览: 196838 次

最近访客更多访客>>

elashu

canofy

longzhiwuing

mmhotsky

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Hadoop关于最大map reducer数目

博客分类：

Hadoop

阅读更多

mapred-site.xml文件：

<property>

<name>mapred.tasktracker.map.tasks.maximum</name>

<value>2</value>

<description>The maximumnumber of map tasks that will be run

simultaneously by a task tracker.

</description>

</property>

<property>

<name>mapred.tasktracker.reduce.tasks.maximum</name>

<value>2</value>

<description>The maximumnumber of reduce tasks that will be run

simultaneously by a task tracker.

</description>

</property>

每个机子的配置可能不一样，所以可以根据具体配置来设置每个tasktracker的最大map 最大reduce数目。

查看http://localhost:50030/machines.jsp?type=active来检查数量

配置完成后，只需要重启配置发生改变的机子，结合公平调度器来使用，可以最大程度上提升性能

Note：有些人可能在集群上打包运行的时候来指定mapred.tasktracker.map.tasks.maximum来改变一个节点上

map数目，但是这个属性只能通过在mapred-site.xml设置，在客户端配置某些属性，将不会产生影响。

分享到：

归一化标准化正则化区别 | java.io.IOException:Typemismatch in key ...

2012-08-14 20:53
浏览 996
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

java操作hadoop之mapreduce计算整数的最大值和最小值实战源码: 本教程将详细讲解如何使用Java编程语言操作Hadoop的MapReduce来计算整数序列中的最大值和最小值，这对于数据分析和处理任务来说是非常基础且实用的技能。首先，我们需要理解MapReduce的工作原理。MapReduce是一种...

hadoop中map/reduce: 《eclipse.docx》可能是关于Eclipse基础使用的文档，包含了Eclipse IDE的基本操作，这对于理解如何在Eclipse中进行MapReduce开发至关重要。至于未列出完整名称的“hadoop”文件，根据上下文推测，这可能是Hadoop...

Hadoop源代码分析（MapTask）: Hadoop源代码分析（MapTask） Hadoop的MapTask类是Hadoop MapReduce框架中的一部分，负责执行Map任务。MapTask类继承自Task类，是MapReduce框架中的一个重要组件。本文将对MapTask类的源代码进行分析，了解其内部...

Hadoop-MindMap-思维导图-读书笔记: Hadoop-MindMap-思维导图-读书笔记

Hadoop-MindMap 技术全解: 在Hadoop-MindMap技术全解中，我们首先接触到的是安装配置部分。这部分会涉及操作系统的选择、网络环境的设置、Java环境的安装、以及Hadoop配置文件的编辑。Hadoop可以在多种操作系统上安装，以Linux为例，需要配置...

hadoop map-reduce turorial: ### Hadoop Map-Reduce 教程详析 #### 目标与作用 Hadoop Map-Reduce框架是设计用于处理大规模数据集（多太字节级）的软件框架，它允许在大量廉价硬件集群上（可达数千节点）进行并行处理，确保了数据处理的可靠性...

hadoop之map/reduce: Reducer的目的是为了对Mapper的输出进行总结或聚合，通常用于计算总计、平均值或者找出最大最小值等。在上述的项目结构中，MapReduce程序被分为三个模块：ebsdi-core、ebsdi-domain和ebsdi-apps。ebsdi-core包含...

远程调用执行Hadoop Map/Reduce: 本篇文章将深入探讨“远程调用执行Hadoop Map/Reduce”的概念、原理及其实现过程，同时结合标签“源码”和“工具”，我们将涉及到如何通过编程接口与Hadoop集群进行交互。 Hadoop MapReduce是一种编程模型，用于大...

Hadoop Map-Reduce: Hadoop Map-Reduce Map-Reduce 是 Hadoop 框架中的一种核心组件，用于处理大规模数据。Map-Reduce 依靠两大步骤来完成数据处理：Map 和 Reduce。 Map 阶段的主要任务是将输入数据拆分成小块，并将其转换成 key-...

第02节：hadoop精讲之map reduce原理及代码.pdf: 3. Shuffle阶段：Hadoop框架将所有Map任务输出的中间键值对进行排序和分组，以便所有具有相同键的值被发送到同一个Reduce任务。 4. Reduce阶段：Reduce任务对具有相同键的中间值进行归约操作，最终输出结果数据。 5....

hadoop Join代码（map join 和reduce join）: 本文将深入探讨Map JOIN和Reduce JOIN两种在Hadoop中实现JOIN的方法，并通过代码示例来阐述它们的工作原理。 1. Map JOIN： Map JOIN在Hadoop中主要应用于小表与大表的连接。小表的数据可以完全加载到内存中，而大...

Windows平台下Hadoop的Map/Reduce开发: 3. Reducer函数定义：Reducer收集来自所有Mapper的相同键的数据，对其进行聚合操作，如计算总和或取最大值。通过以上步骤，初学者可以逐步熟悉Windows环境下Hadoop的安装、配置和开发流程，从而顺利入门Map/Reduce...

Hadoop Map Reduce教程: - **API**：Hadoop 提供了丰富的 API 来编写 MapReduce 应用程序，包括 `Mapper` 和 `Reducer` 接口。 - **配置**：通过 `Configuration` 类来设置各种参数，如输入输出路径、Mapper 和 Reducer 类以及文件分割策略...

Hadoop Map-Reduce教程: 4. **Reducer**: 每个 Reduce 任务接收来自多个 Map 任务的键值对，并进一步处理这些键值对，生成最终的结果。 5. **Output**: 最终结果被写入到 HDFS 中。 #### 四、Map-Reduce 的应用场景 Hadoop Map-Reduce ...

第02节：hadoop精讲之map reduce原理及代码.rar: 在大数据处理领域，Hadoop是不可或缺的一个开源框架，它提供了分布式存储和计算的能力。本节主要探讨的是Hadoop中的核心组件MapReduce的原理及其编程模型。MapReduce是一种编程模型，用于大规模数据集（大于1TB）的...

最高气温 map reduce hadoop 实例: 【标题】：“最高气温 map reduce hadoop 实例” 在大数据处理领域，Hadoop是一个不可或缺的开源框架，它专为分布式存储和处理大量数据而设计。本实例将介绍如何使用Hadoop MapReduce解决一个实际问题——找出给定...

利用Spring搭建基于Hadoop的大数据分析.zip: 你可以使用`org.springframework.hadoop.mapreduce.MapReduceConfigurer`来配置Mapper和Reducer类，以及相关参数。 6. **Job执行和监控**：Spring提供了`org.springframework.hadoop.mapreduce....

Hadoop示例程序WordCount运行及详解: Hadoop平台上进行WordCount是非常重要的，掌握了WordCount可以更好地理解Hadoop的map-reduce编程模型。本文将详细讲解Hadoop平台上WordCount的运行和实现。基于Hadoop的map-reduce模型，WordCount程序可以将输入的...

hadoop几个实例: 以下是关于Hadoop的一些核心知识点，以及可能在这些实例中涉及的内容。 1. **Hadoop架构**：Hadoop主要由两个核心组件构成，HDFS（Hadoop Distributed File System）和MapReduce。HDFS负责数据的分布式存储，而...

hadoop中文乱码问题: 【Hadoop中文乱码问题详解】在大数据处理领域，Hadoop是一个不可或缺的开源框架，它提供了分布式存储（HDFS）和分布式计算（MapReduce）的能力。然而，在处理包含中文字符的数据时，用户可能会遇到中文乱码的问题...

Global site tag (gtag.js) - Google Analytics