最新文章列表

Hadoop入门

原文地址:http://blog.csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布 ...
wind_bell 评论(3) 有48534人浏览 2007-05-21 10:09

Nutch源代码给我的收获

1)构建搜索引擎的一般模式。虽然,原来在读网络机器人这本书的时候就大致了解了构建一个搜索引擎所需要的几个组成部分,但只有真正接触Nutch这样真实,全面,可行的解决方案后,才真正能对搜索引擎的一般模式有所了解 2)并行编程和算法。以前就知道搜索引擎里的算法都是并行,但如何构建这样的程序完全没有谱。但Nutch给出了例子和答案。 3)map reduce模型。以前读过google lib里面关于ma ...
cutesource 评论(0) 有1933人浏览 2007-05-18 11:00

Hadoop-- 海量文件的分布式计算处理方案(转)

    Hadoop 是Google MapReduce的 一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同j ...
cutesource 评论(0) 有1228人浏览 2007-05-15 10:09

Map Reduce - the Free Lunch is not over?(转)

微软著名的C++大师Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software“,预言OO之后软件开发将要面临的又一次重大变革-并行计算。 摩尔定律统制下的软件开发时代有一个非常有意思的现象:”Andy giveth, and Bill tak ...
cutesource 评论(0) 有969人浏览 2007-04-21 15:54

Java cleanup code

Java shutdown hook guarantee that clean-up code is always run, regardless of how the user terminates the application. Here is an example from Hadoop: java 代码 /**    * A class to track the l ...
willpower 评论(0) 有1291人浏览 2007-04-03 12:20

How to know the main class of a jar file?

Easy. Here is an implementation from Hadoop. java 代码 /**    * A micro-application that prints the main class name out of a jar file.    * @author Owen O'Malley    */   public cla ...
willpower 评论(0) 有1025人浏览 2007-04-02 15:18

Map Reduce - the Free Lunch is not over? (From Internet)

This is a really good article, I love... Map Reduce - the Free Lunch is not over? Posted: 2006-11-16 02:29 微软著名的C++大师Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Towa ...
willpower 评论(0) 有925人浏览 2007-03-21 20:01

毕业设计3---Nutch的使用

        今天研究了Nutch, 差不多已经好几个小时了, 到现在还没有搞定,也这么晚了, 先记录下来,明天继续吧。        一开始很多时间都浪费在了cygwin的安装上了,bs这个软件的开发者了, 一个不伦不类的软件安装程序,安装的时候还要从网上下载东东。。。。。不过最后终于装成功了, 先下载到本地后,再安装的(建议 下载站点中选 TW的比较块)。    下面是我安装CYGWIN和NU ...
fullfocus 评论(1) 有3546人浏览 2007-03-02 00:53

有没有什么rss crawl,或者web crawl也行

公司想要做个 rss crawl去www上的爬所有的rss link的地址,这个想法跟web crawl类似。把爬得的rss地址保存起来。 不知道有没有人知道没有现成的open source的rss crawl或者 web crawl也行呀 谢谢
dengyin2000 评论(10) 有3954人浏览 2007-02-28 22:56

最近博客热门TAG

Apache(33931) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics