最新文章列表

MPI和map-reduce区别

        mpi对于分布式文件存储(数据密集型、非计算密集型)支持较少,它适用于计算密集型,另外对于类似于hadoop的datanode、tasknode来讲,同一个工作站既做计算(task),又做存储(data),而且优先处理本地的数据,这样的设计比较优雅
daniel0202 评论(0) 有1072人浏览 2014-04-01 22:44

Hadoop YARN(转)

带有 MapReduce 的 Apache Hadoop 是分布式数据处理的骨干力量。借助其独特的横向扩展物理集群架构和由 Google 最初开发的精细处理框架,Hadoop 在大数据处理的全新领域迎来了爆炸式增长。Hadoop 还开发了一个丰富多样的应用程序生态系统,包括 Apache Pig(一种强大的脚本语言)和 Apache Hive(一个具有类似 SQL 界面的数据仓库解决方案)。 ...
wbj0110 评论(0) 有773人浏览 2014-01-30 09:34

Using the Aggregate package in Java is explained

http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/lib/aggregate/package-summary.html
wbj0110 评论(0) 有911人浏览 2013-11-11 11:09

使用 Map-Reduce 统计Web 服务器 access.log 日志文件

  1.6. Map-Reduce 1.6.1. 使用 Map-Reduce 统计Web 服务器 access.log 日志文件     首先将web服务器access.log倒入到mongodb,参考 http://netkiller.github.io/article/log.html。 格式如下: { "_id" : ObjectId("5 ...
netkiller.github.com 评论(0) 有973人浏览 2013-07-15 13:56

在eclipse下运行Map-Reduce程序

在eclipse下运行Map-Reduce程序: 1,在eclipse新建项目。 File-->New-->Other-->Map/Reduce Project 项目名可以随便取,如 HadoopTest 。 复制 hadoop 安装目录 /src/exam ...
zhangbaoming815 评论(0) 有1575人浏览 2012-07-12 20:27

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics