- 浏览: 1189133 次
- 性别:
- 来自: 北京
-
最新评论
-
pandaball:
支持一下,心如大海
做有气质的男人 -
recall992:
山东分公司的风格[color=brown]岁的法国电视[/co ...
solr是如何存储索引的 -
zhangsasa:
-services "services-config ...
flex中endpoint的作用是什么? -
来利强:
非常感谢
java使用json所需要的几个包 -
zhanglian520:
有参考价值。
hadoop部署错误之一:java.lang.IllegalArgumentException: Wrong FS
文章列表
用过 Redhat 的朋友应该很熟悉 ll 这个命令,就相当于 ls -l,但在 Ubuntu 中就不行了。严格来说 ll
不是一个命令,只是命令的别名而已。很多 Linux 用户都使用 bash shell,对普通用户来说用得最多的就是命令补全 (按 tab 键)
和 alias (别名) 功能。Ubuntu 默认建立的用户都用的 bash shell,所以它也支持别名功能,我们只需要 gedit
~/.bashrc 这个文件.
去掉 #alias ll='ls -l'
前面的 # 号就能使用 ll 命令了。
lifehacker
也介绍到,在 Ubuntu 上建立一些常用 ...
<script type="text/javascript">
document.body.oncopy = function() {
if (window.clipboardData) {
setTimeout(function() {
...
新建文件 ~/.vimrc是用户自己的vim配置文件,在这个配置文件中设置的配置只影响该用户自己。
命令如下:
cd ~
vi .vimrc
输入:syntax on
保存退出
source .vimrc
此时可以找一个xml文件 进行查看,看看是不是已经有颜色了
vim xxx.xml
给 vi 做个别名,
# vi ~/.bashrcalias vi='vim'
# source ~/.bash_profile
注:syntax on ,显示颜色;syntax off ,则不显示颜色。
eclipse 中使用 svn 插件,原本正常,未作任何更改,突然有一天, eclipse 中查看文件时,文件后面的 版本号 、 文件的状态图标 等等都不见了。
检查插件都在,更新,提交等操作都能正常使用,唯独看不到状态了。
经过一番查找,找到问题解决办法。
打开 : windows ->preferences->General->Appearance->Lable Decoration
s 勾选其中的 SVN
项即可。
System.getProperty() 参数大全
java.version Java Runtime Environment version
java.vendor Java Runtime Environment vendor
java.vendor.url Java vendor URL
java.home Java installation directory
java.vm.specification.version ...
相信很多人都运用
过<input type="file"/>
这样的HTML控件,它看起来非常普通,是我们在做Web运用
程序中用于上传客户端本地文件时不可缺少的控件,然而最近我发觉
这个控件在最新的FireFox阅读
器(或者最新的IE8中也会存在这个疑问
,我没有尝试过,读者可以试一下)中却失去了效果,导致我们在通过这个控件的value属性得到的值中只包含了文件名而没有文件路径,这个在IE7
中是可以正常获取到全文件名的(即文件完整路径+文件名)。在IE中我们可以直接通过request.getParamter("file"); ...
由于生成的xml中需要有:
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 一个指令
Element root = new Element("configuration"); Document doc = new Document(root); ProcessingInstruction pi = new ProcessingInstruction("xml-stylesheet", &quo ...
今天是2009年的最后的一天,感觉挺兴奋的!以前都没有这种感觉,呵呵!先把这一年的工作做个总结吧!
1、这一年经历了两个公司,公司的名字就不说了,以前主要在上家公司做的东西比较杂,比如:web
(1):项目管理、webCrawl。
(2):日本外包(flex项目,这个估计是今年以来最大的看头了吧!界面比较炫。)
(3):search engine(也是今年刚刚接触的东西,比较著名的大家可能都知道:google,yahoo,baidu等)主要涉及到了数据瓦据,数据的提取等。
以前做的web方面的东西比较多,一个页面大部分的都是javascript (Ajax),这方 ...
给大家介绍在IDE中所使用的反编译的plugin. ---- jd-eclipse.很强悍的!支持eclipse3.2以上的版本。给出链接吧:
http://java.decompiler.free.fr/?q=jdeclipse#install
今天在公司做nutch的调试时,犯了一个低级的错误,在这里记录下,提醒下大家,以后不要犯此类的错误。
我们知道nutch-default.xml中有一个:
<property>
<name>plugin.folders</name>
<value>plugins</value>
<description>Directories where nutch plugins are located. Each
element may be a relative or absolute path. ...
把另外的一个项目加入了nutch中来
- 博客分类:
- nutch
周末在家闲的慌,把在公司搞的nutch拿回来在家里试着做了下,刚开始总以为把一个项目都以plugin的形式加入到nutch中来,是不是有点.......嗨,搞呗。周日竟然成功了,分享下新得先。
先贴出来先日志的东东吧,我们要求的是nutch边从网站上爬取,所加入的项目(plugin)得边去解析(抽取)数据。就这么简单,插件的介绍在上几次已经介绍过了,看下日志:
product_name = The Incident (CD) product_price = $14.01 product_image = http://i43.tower.com/images/mm113708247/ ...
周末在家里搞nutch的plugin,自己写的类从新执行的时候出现progrem exit ..... ,开始寻找原因。呵呵。解决:
Eclipse出现不编译(clean和勾选Build Automatically都不能自动编译)的情况,一般是因为你的项目的Build path里存在找不到的jar包,可能是因为以前引入了某个jar包,现在删掉或者转移路径了,这时候就会出现不编译的问题。
解决方法: 打开项目的Build Path,将Libraries里的jia包删掉再重新加载,勾选Build Automatically,试一下吧。
接上面一篇,今天来用一个例子来详细讲解下nutch当中到底是如何自定义插件的。
1.首先在src/plugin/,新建一个文件夹,这个文件夹我们姑且就叫(urlfilter-urllength
),从名字就可以看出我们这个自定义的插件的作用是什么了。
1.我们这个类实现了URLFilter.当然要实现其没有实现的方法了。public class UrlLengthFilter implements URLFilter。
2.下面贴出详细的源码看下:
public class UrlLengthFilter implements URLFilter
{
...
当某个插件需要被加载时, Nutch 会加载所有插件的相关接口到缓存,此后每个插件需要实例的时候,根据相关接口和相关接口实现实例在缓存内的记录,使用反射实现一个实例并返回,下面以 QueryFilter 的所有插件被加载例子进行说明。
具体代码参看org.apache.nutch.seacher.QueryFilters<init>
( 1 )当第一次需要得到 QueryFilter 的一个子类的实例时,使用下面这句话试图获得所有的实例:
this.queryFilters =
(QueryFilter[]) conf.getObject(QueryFilter. ...
PluginRepository 是plugin的入口,保存了所有的Plugins,加载流程如下:
1. 解析plugin.folder下面的所有plugin的plugin.xml文件:
几个主要的解析函数如下:
(1) parseExtension(rootElement, pluginDescriptor);
解析extension element:
<extension id="org.apache.nutch.net.urlfilter.urllength"
name="Nutch URL Leng ...