本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
做人要厚道,转帖请贴出原帖url
网上找文章经常看见一篇文章被转了N次
并且都不贴原文地址
并且连文章图片格式也不管就直接copy
到自己的网站或blog
有些blog花哨的基本就看不清
恼火
转帖还是希望能贴出原帖的地址
大家也许去原帖blog或网站可以了解更多的东西
呵呵 废话几句
学Google、Baidu定制自己的Apache(只改HTTP响应头Server的名称而已^_^)
[list]
1. 下载Apache源代码:我用的是 httpd-2.0.63.tar.gz
2. 解压压缩包(tar -zxvf httpd-2.0.63.tar.gz)后, 只需修改两个文件:
文件一: os/unix/os.h
#define PLATEFORM "Debian" // 本人使用的是Debian
文件二: include/ap_release. ...
说实话我只能灌水,我谈技术你们有几个懂的啊?不信?随便发一段我写的代你们有几个能看懂的啊?
说实话我只能灌水,我谈技术你们有几个懂的啊?不信?随便发一段我写的代你们有几个能看懂的啊? 视频: 刘德华中国人 藏拙贴吧视频音乐了 视频发表方法: 跟发表图片一样,只要链接是以 .swf 结尾系统就会默认为你发表的是视频了 音乐发表方法: 跟发表图片一样,只要链接是以 .mp3 或 .wma 结尾系统就会默认为你发表的是音乐了 其余的都按照图片方式进行处理 相关处理代码 int LinkTyp ...
TechCrunch50初创产品介绍(八):FitBit
Fitbit网站鼓励人们多锻炼、吃点好一点,以健康的方式生活。Fitbit公司正开发一个叫做Fitbit跟踪器的缩微型、可穿戴式的无线感应器,这个感应器可以自动跟踪和计算个人运动的数据,比如卡路里燃烧量、睡眠质量、行走的步伐数量和距离。
Fitbit跟踪器手机人体全天内的活动数据。这些搜集到的数据通过无线上传到网站上,这样跟踪器的佩戴者可登陆网站看到自己的数据,跟踪个人目标的进展 ...
Nutch开源搜索引擎增量索引recrawl的终极解决办法(续)
十一要放假了,先祝广大同学们节日快乐!
在之前的一篇文章中,我给出了Nutch的recrawl的解决办法。说实话,当时已经觉得可以应对recrawl的问题,但是我自己在测试过程中发现,在index的merge时,并没有完全成功。本文就是针对上一篇文章给出解决办法。
具体的原因是在merge完成后,会在index目录下面生成一个merge-output目录,这是由于临时目录newindexs和in ...
Nutch:一个灵活可扩展的开源web搜索引擎
在网上找到一篇于2004年11月由CommerceNet Labs出具关于Nutch的技术研究报告,报告由DougCutting和CommerceNet Labs的三位研究员一起来完成的。
报告的全名是Nutch: A Flexible and Scalable Open-Source Web Search Engine。基本描述了Nutch、Lucene与其它开源搜索软件的比较,Nutch的组成 ...
Google公司都是些什么牛人?
Google公司都是些什么牛人?
1 Vinton Cerf :号称互联网之父,TCIP/IP协议和互联网架构的合作设计者。他05年10月3日开始正式为Google工作,职位为"首席互联网传布官"。
2 Joshua Bloch :号称java教父,《Effective Java》《JAVA PUZZLE》的作者,JSR175标准的leader,J2SE ...
搜索引擎名人堂之Doug Cutting
Doug Cutting是一个开源搜索技术的提倡者和创造者。他和Mike Cafarella发起Lucene和Nutch开源搜索项目,这些项目现在被Apache软件基金会管理。早期开发Luncene,Doug研究搜索技术还在Excite,apple公司和Xerox PARC。Lucene是一个搜索索引索器,Nutch有一个蜘蛛或爬虫,是一个普通开源搜索平台的两个关键组件,首先爬取网络内容,然后将其构 ...
Nutch开源搜索引擎增量索引recrawl的终极解决办法
本文重点是介绍Nutch开源搜索引擎如何在Hadoop分布式计算架构上进行recrawl,也就是在解决nutch增量索引的问题。google过来的章中没有一个详细解释整个过程的,经过一番痛苦的研究,最后找到了最终解决办法。
先按照自己部署好的Nutch架构写出recrawl的shell脚本,注意:如果本地索引,就需要调用bash的 rm、cp等命令,如果HDFS上的索引,就需要调用hadoop d ...
Nutch开源搜索引擎与Paoding中文分词用plugin方式集成
本文是我在集成中文分词paoding时积累的经验,单独成一篇文章来重点介绍,重点需要了解的有下面几个文件,a)插件目录及插件文件 build.xml,plugin.xml b)nutch-0.9\src\plugin\build.xml c)WEB-INF/classes/nutch-site.xml
然后通过按照下面的方式来配置,执行ant package就可以搞定了,这里用ant的方式来处理 ...
可能用得着的firefox插件
1. Adblock plus(插件的插件:Element Hiding Helper)
想要什么,不想要什么,由我决定。
2. Tamper Data
想给什么,不想给什么,由我决定。
3. Mouse gestures Redox(代替品:FireGestures)
鼠标随便一划拉,你就得给我干活。
4. Easy DragTogo(代替品:QuickDrag)
拖 ...
MapReduce-免费午餐还没有结束?
Map Reduce - the Free Lunch is not over?
微软著名的C++大师Herb Sutter
在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward Concu ...