本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
Hadoop源代码分析(一)
经济不行啦,只好潜心研究技术。 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。 GoogleCluster: http://research.google.com/archive/googlecluster.html Chubby:http://labs.google.com/papers/chubby.html GFS:http://labs ...
大型应用开发的各种可伸缩性解决方案相似之处
在数据层我们看到如下特征:
增加一个缓存层以利用可用内存资源并减少I/O开销
从中央数据库方式转向分区方式,也称为shards(注:shards 是google贡献给hibernate的一个项目,目标是通过hibernate在多重数据库上提供一个统一的视图。)
在业务逻辑层:
给应用层增加并行语义(如MapReduce、for...join)
转向向外扩展(scale-out)应用模 ...
怎么在hadoop作map/reduce时输出N种不同类型的value
BTW:再次感叹下没有机器, 3.4G的语料,单机处理了10来个小时, 真是郁闷~~ 要是有N台机器多好啊.
在很多时候,特别是处理大数据的时候,我们希望一道MapReduce过程就可以解决几个问题。这样可以避免再次读取数据。比如:在做文本聚类/分类的时候,mapper读取语料,进行分词后,要同时算出每个词条(term)的term frequency以及它的document frequency. ...
三年程序员的我该怎么办
转眼间工作三年了,三年中一直在老老实实的埋头写自己的程序,也从来没有在什么论坛上发过帖子。然而今天在回家的路上我却对未来充满了迷茫,我该怎么走。
我做java开发到设计到带项目三年,没有做过什么惊天动地的大项目,也没有掌握什么舍我其谁的技术,我的简历上来来回回也只有和java相关的几个项目。在招聘网站上搜索职位每每搜索到软件工程师、高级软件工程师的时候总有一种窃喜的 ...
为什么大多数大型网站不是用Java写的
国庆长假,老外在热烈的讨论这个话题,
原文地址: http://natishalom.typepad.com/nati_shaloms_blog/2007/10/why-most-scalab.html
我摘录部分观点如下:
Most of these sites are using LAMP as the core runtime stack
Some develop their own file ...