最新文章列表

MPI和map-reduce区别

        mpi对于分布式文件存储(数据密集型、非计算密集型)支持较少,它适用于计算密集型,另外对于类似于hadoop的datanode、tasknode来讲,同一个工作站既做计算(task),又做存储(data),而且优先处理本地的数据,这样的设计比较优雅
daniel0202 评论(0) 有1089人浏览 2014-04-01 22:44

Hadoop YARN(转)

带有 MapReduce 的 Apache Hadoop 是分布式数据处理的骨干力量。借助其独特的横向扩展物理集群架构和由 Google 最初开发的精细处理框架,Hadoop 在大数据处理的全新领域迎来了爆炸式增长。Hadoop 还开发了一个丰富多样的应用程序生态系统,包括 Apache Pig(一种强大的脚本语言)和 Apache Hive(一个具有类似 SQL 界面的数据仓库解决方案)。 ...
wbj0110 评论(0) 有781人浏览 2014-01-30 09:34

Using the Aggregate package in Java is explained

http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/lib/aggregate/package-summary.html
wbj0110 评论(0) 有926人浏览 2013-11-11 11:09

使用 Map-Reduce 统计Web 服务器 access.log 日志文件

  1.6. Map-Reduce 1.6.1. 使用 Map-Reduce 统计Web 服务器 access.log 日志文件     首先将web服务器access.log倒入到mongodb,参考 http://netkiller.github.io/article/log.html。 格式如下: { "_id" : ObjectId("5 ...
netkiller.github.com 评论(0) 有973人浏览 2013-07-15 13:56

在eclipse下运行Map-Reduce程序

在eclipse下运行Map-Reduce程序: 1,在eclipse新建项目。 File-->New-->Other-->Map/Reduce Project 项目名可以随便取,如 HadoopTest 。 复制 hadoop 安装目录 /src/exam ...
zhangbaoming815 评论(0) 有1584人浏览 2012-07-12 20:27

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54917) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37267) 数据结构(36420)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics