浏览 5494 次
锁定老帖子 主题:mapreduce的原理详解
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2011-01-06
接前一篇博客 以前的文章中有关于mapreduce的工作原理:http://p-x1984.iteye.com/blog/702486 记住一点:Map的输出既是Reduce的输入。即: Map:<k1,v1> ->list<k2,v2> Reduce:<k2,list<v2>> -><k3,v3> 1) 在启动map函数前,需要对输入文件进行“分片”,也就是把所要输入的文件copy到HDFS中。 大家如果有兴趣的可以和我一起讨论! 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2011-01-07
是在客户端先分好片,然后将分片信息上传到hdfs,然后jobtracker拿到分片信息,来分配map,reduct task的。
|
|
返回顶楼 | |
发表时间:2011-01-07
多谢提醒!
|
|
返回顶楼 | |