本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
- sichunli_030
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- e_e
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- johnsmith9th
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- forestqqqq
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
- jveqi
- java-007
- sunj
最新文章列表
MapReduce & Hadoop
MapReduce & Hadoop
2.2.1示例
考虑这样一个例子,在一个很大的文档集合中,计算每一个单词出现的次数。
可以使用下面的伪代码表示:
Map(String key, String value):
Nutch 研究<三> 将Nutch爬取结果放入Hypertable
想把Nutch抓取的web page结果放入到Hypertable中去,目前思路主要有三个:
1. 修改Nutch源代码,让Nutch基于Hypertable工作,可以参考Hbase的实现. 由于该实现缺失Nutch好多特性,而且不易升级,考虑作罢.
2. 将Nutch抓取结果以命令导出为text的dump文件,然后用MapReduce解析该文件,哪相关信息到Hypertable.
3. 其实 ...
分布式计算开源框架Hadoop介绍
引用Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。对于我来说,最近的一个使用点就是服务集成平台的日志分析。服务集成平台的日志量将会很大,而这也正好符合了分布式计算的适用场景
什么是Hadoop?
搞什么东西之前,第一步是要知道What(是什么),然后是Why(为什么),最后才是How(怎么做)。但很多 ...
Nutch 的集群式搜索引擎
eclipse插件经典收集
http://www.javago.net/eclipse_plug/index.htm
oracle ,mysql,sqlserver,sybase经典文章收集
http://www.javago.net/db_pindao.html
java专题研究,面试题收集 ...
你的编程语言可以这样做吗?
繁体中文翻译见: 你的程式語言可以這樣做嗎?
emu翻译的版本
你的编程语言可以这样做吗?
From The Joel on Software Translation Project
<!-- start conten ...