- 浏览: 485759 次
- 性别:
- 来自: 湖南
-
最新评论
-
youngcoder:
good job
HTTP协议头部与Keep-Alive模式详解 -
javazdq:
受教了 解释的不错。
lucene创建索引高级特性和索引创建参数优化 -
josico:
有几个问题想问下楼主1. LinkedBlockingQueu ...
生产者-消费者-BlockingQueue -
annybz:
有没有关于 BlockingQueue和ConcurrentL ...
生产者-消费者-BlockingQueue -
uniquejava:
多谢,记录的很真实。
DB2 学习记录
文章列表
以前老是碰到QQ帐号限制登录的问题,今天突然MSN登不上了,在账户里显示“已断开-未指定原因”,怎么解决?
sudo gedit /usr/share/pyshared/papyon/service/description/SingleSignOn/
RequestMultipleSecurityTokens.py
找到
CONTACTS = ("contacts.msn.com", "?fs=1&id=24000&kv=7&rn=93S9SWWw& ...
研究了好久3D桌面效果,终于找到这个好方法了。CompizConfig设置管理器的功能实在是
太强大了。在Ubuntu 8.04下测试通过。
首先安装CompizConfig设置管理器(3D驱动必须装好)
sudo apt-get install
compizconfig-settings-manager
运行 系统->首选项->Advanced Desktop Effects
Settings,点击General Compiz options,把Desktop
Size选项卡里的“水平虚拟大小”设置为4,“垂直虚拟大小”设置为1,“桌面数 ...
为什么需要代码覆盖率分析?
在发布代码的时候,我们常常会对其进行一系列的测试来协调软件的性能和功能,使他们和预计的相同。但是检验通常都是相当的困难,即使程序相当的简单。开发者常常会借助一些
测试工具(
...
Nutch-0.9源代码:Crawl类整体分析
Nutch-0.9中,org.apache.nutch.crawl.Crawl类中提供了一个入口主函数main,通过接收键入的命令
行,根据命令行指定的参数对Nutch进行配置,从而启动Nutch抓取程序,通过阅读org.apache.nutch.crawl.Crawl类的源
代码来了解Nutch是如何根据接收的命令行进行配置及其启动的。
org.apache.nutch.crawl.Crawl类的主函数如下所示:
// 应该知道,Nutch查找文件系统是基于Linux系统的机制的,所以提供启动的命令与Linu ...
网络爬虫调研报告
调研背景
项目中要对指定的网络资源进行抓取、存储、分类、索引、并提供检索服务。充当全文检索数据库的是
Apache
组织下的开源项目
Lucene
检索工具,而
Lucene
只是个搜索引擎工具,它提供
API
接口,通过编写程序对信息进行索引和检索,在其后台需要网络爬虫程序的支持,其目的是通过
网络爬虫软件抓取网页,作为提供给
Lucene
搜索引擎的资源,进行索引和查询。
调研对象
Nutch
...
配置完成nutch容易出现的错误
1.1.2 运行crawl报错Job failed
Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:604)
at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java:439)
at org ...
Nutch1.0的配置与运行
配置软件:
1、 Java jdk-1.6
1.1 下载安装
from: http://www.sun.com
安装目录:C:\Java\jdk1.6.0_03
1.2 修改环境变量
JAVA_HOME=C:\Java\jdk1.6.0_03\bin
CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0_03\lib\tools.jar
1.3 测 ...
使用 Cobertura 报告代码覆盖率
是否达到 100% 就是问题所在
运行像 Cobertura 或者 Emma 这样的工具时,记住以下方面很重要:在一个特殊的方法中实现 100% 的行覆盖并不意味着该方法没有缺陷或者它已被完全测试。例如,如果您编写了一个针对 if
语句的测试,该测试包含逻辑 And
,而测试针对的是表达式的左侧部分,则像 Cobertura 这样的工具将报告 100% 行覆盖,但是实际上,您仅执行了该语句的 50%;因此仅完成了 50% 的分支覆盖。
现在已经编写了一些测试,如何确定所有这些测试执行什么 ...
由于大家平日多伏案工作,常听不少同事提到颈椎有各种程度的不适!目前最新的调查
也显示:由于长期慢性劳损,颈椎病的发病年龄已经从40岁提前到3 0岁,并成为名副
其实的白领职业病。更让人担心的是,颈椎上承头颅, ...
Nutch1.0的配置与运行
配置软件:
1、 Java jdk-1.6
1.1 下载安装
from: http://www.sun.com
安装目录:C:\Java\jdk1.6.0_03
1.2 修改环境变量
JAVA_HOME=C:\Java\jdk1.6.0_03\bin
CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0_03\lib\tools.jar
1.3 测 ...
Nutch的资料
http://issues.apache.org/jira/browse/NUTCH-36
http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03907.html
以上两个链接的内容出处相同,都是Apache Nutch dev mail archive。
由Jack Tang于04-Apr-2005提出,是描述在Nutch搜索中加入中文支持的技术。
因为刚刚提出,没有成熟,需要探索才能使用,有点挑战!希望早日搞定!
Nutch JavaDoc O ...
(一):
Nutch
的工作流程:
Crawdb
、
linkdb
是
web link
目录,存放
url
及
url
的互联关系,作为爬行与重新爬行的依据。
segments
是主目录,存放抓回来的网页。页面内容有
linux超级基础系列——shell变量(本地变量和环境变量)
为使shell编程更有效,系统提供了一些shell变量。shell变量可以保存诸如路径名、文件名或者一个数字这样的变量名。shell将其中任何设置都看做文本字符串。
有两种变量,本地和环境。严格地说可以有4种,但其余两种是只读的,可以认为是特殊变量,它用于向shell脚本传递参数。
1 什么是shell变量
按照定义来说,变量是存储
设备中的一些可读写的存储单元.变量可以定制用户本身的工作环境。使用变量可以保存有用信息,使系统获知用户相关设置。变量也用于保存暂时信息。例如:一
变量为EDITOR,系统中 ...
首先,我们先换
10.04
的源:
sudo vi /etc/apt/sources.list
在打开的文档里将原
来的内容全部删除,添加下面列表中最适合你的源(注意不要全部添加),选择一个最合适你的即可,复制到你的列表中,然后保存列表。
如果担心失败就先将9.04的sources.list备份吧!
Ubuntu
10.04
源列表:
台湾
deb http://tw.archive.ubuntu.com/ubuntu/ lucid main universe restricted multiverse
deb- ...
简介:
重要数据的丢失可能意味着致命的破坏。尽管如此,还是有无数专业人员忽视了对他们的数据的备份。虽然原因可能各不相同,但是,最常
见的一个解释是,执行例行备份确实烦琐。由于机器擅长于完成普通而重复的任务,因此,自动化备份的过程是降低工作内在的枯燥性和人们与生俱来的拖延倾向的
关键所在
如果您使用 Linux,那么您就可以使用创建定制备份解决方案的极其强大的工具。本文中的解决方案可以让您使用开源工具执行从简单的到更高级而且安全的网络备份,几乎所有 Linux 发行版本都包含这些工具。
原文:http://www.ibm.com/developerworks/c ...