hadoop--关于MapReduce - - ITeye博客

`

W.sl

浏览: 21006 次
性别:
来自: 杭州

最近访客更多访客>>

思密达-

人工智障V6

Starnop

youngitachi

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hadoop--关于MapReduce

博客分类：

Hadoop

阅读更多

MapReduce任务过程被分为两个阶段：map和reduce。

每个阶段都需要以键/值作为输入和输出，程序员需要定义两个函数map()，和reduce()。

在处理天气预报整个大数据时，我们只对年份和气温这两个属性感兴趣

map函数的输出经由mapreduce框架处理后，最后被发送到reduce函数。这一过程中需要对键/值对进行排序和分组。因此reduce会收到下面的输入：

（1949，[111,78]）

（1950，[0,22,-11]）

每一年份后紧跟着一系列的温度，因此reduce需要做的就是遍历整个数据表找到最大的读数。

（1949，111）

（1950，22）

横向拓展：

这个例子介绍了针对少量输入数据是如何工作的，我们只用了本地文件系统中的文件，然后为了实现横向拓展，我们需要把数据存储在分布式文件系统中，一般为HDFS，由此允许Hadoop将MapReduce计算转移到存储有部分数据的各台机器上。

查看图片附件

分享到：

启用smaba服务 | linux命令

2016-07-04 16:26
浏览 574
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop-mapreduce-client-app-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-app-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.6.5-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-app-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-app-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.6.5-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-core-2.5.1-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.5.1.jar；赠送原API文档：hadoop-mapreduce-client-core-2.5.1-javadoc.jar；赠送源代码：hadoop-mapreduce-client-core-2.5.1-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop-mapreduce-client-app-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-app-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-app-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-app-2.7.3-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-client-core-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.6.5.jar 赠送原API文档：hadoop-mapreduce-client-core-2.6.5-javadoc.jar 赠送源代码：hadoop-mapreduce-client-core-2.6.5-sources.jar 包含翻译后的API文档：...

hadoop-mapreduce-client-core-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-core-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-core-2.7.3-sources.jar；赠送Maven依赖信息文件：...

hadoop-mapreduce-examples-2.7.1.jar: hadoop-mapreduce-examples-2.7.1.jar

hadoop-mapreduce-examples-2.6.5.jar: hadoop-mapreduce-examples-2.6.5.jar 官方案例源码

hadoop-mapreduce-client-common-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-common-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-common-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-common-2.6.5-sources.jar；赠送Maven依赖信息...

hadoop-mapreduce-client-core-2.5.1.jar: hadoop-mapreduce-client-core-2.5.1.jar，mapreduce必备组件，供学习使用欢迎下载

hadoop-mapreduce-examples-2.6.0: Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据...

hadoop-mapreduce-client-core-2.6.5.jar: hadoop-mapreduce-client-core-2.6.5.jar

hadoop-mapreduce-client-core-2.7.1.jar: hadoop-mapreduce-client-core-2.7.1.jar，java开发的jar包需要的直接下载

hadoop最新版本3.1.1全量jar包: hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

hadoop-mapreduce-client-common-2.7.3-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-common-2.7.3.jar；赠送原API文档：hadoop-mapreduce-client-common-2.7.3-javadoc.jar；赠送源代码：hadoop-mapreduce-client-common-2.7.3-sources.jar；赠送Maven依赖信息...

hadoop-eclipse-plugin1.2.1 and hadoop-eclipse-plugin2.8.0: 这个版本的插件支持Hadoop 1.x系列，适配的是Hadoop MapReduce的旧版API（即MapReduce v1，也称为Classic MapReduce）。它允许开发者在Eclipse中直接浏览HDFS文件系统，创建新的Hadoop项目，并通过“Run As”菜单...

hadoop-mapreduce-client-hs-2.7.1.jar: hadoop-mapreduce-client-hs-2.7.1.jar

hadoop-mapreduce-client-common-2.6.0.jar: java运行依赖jar包

Global site tag (gtag.js) - Google Analytics