`
junjie314
  • 浏览: 60241 次
  • 性别: Icon_minigender_1
  • 来自: 宁波
文章分类
社区版块
存档分类
最新评论
文章列表
为了实现网站的日志管理,研究了几天的spring事务管理终于OK了!两种方法 方法一:实现对目标类进行拦截(对于有接口的类,使用的是Java内部类提供的Proxy;而对于那些不实现接口的类,使用的是cglib库) xml 代码 <!-- Bean configuration -->     <bean id="businesslogicbean"      class="org.springframework.aop.framework.ProxyFactoryBean">        < ...
转载自: http://www.jscud.com/srun/news/viewhtml/2_2005_8/71.htm   最近在研究lucene的全文检索,在很多地方需要解析或者说分析Html内容或者Html页面,Lucene本身的演示程序中也提供了一个Html Parser,但是不是纯Java的解决方案.于是到处搜索,在网上找到了一个"HTMLParser". 网址是: http://htmlparser.sourceforge.net ,当前版本为1.5. 下载下来,试用一番,感觉不错,完全能满足lucene解析Html的需求. 过几天贴出lucene进行全文检索的 ...
// 创建索引     public void indexFiles() {         // 创建索引文件存放路径         File indexDir = new File("E:\\lucene_Learning\\lucene-2.0.0src\\src\\demo\\index");         try {             Date start = new Date();             // 创建分析器,主要用于从文本中抽取那些需要建立索引的内容,把不需要参与建索引的文本内容去掉.             // 比如去掉一 ...
转载:http://www.jscud.com/srun/news/viewhtml/3_2005_8/78.htm   关键字:lucene,html parser,全文检索,indexreader,document,field,indexwriter,term,htmlpage  无论是建立索引还是分析内容,都是为了用户的搜索服务.    在lucene中,如果需要使用搜索,需要使用searcher类,这是一个抽象类,它有2个子类:indexsearcher和multisearcher.    indexsearcher是对一个索引进行搜索,如果你需要对多个索引进行搜索,可以使用multi ...
转载:http://www.jscud.com/srun/news/viewhtml/3_2005_8/77.htm   在使用lucene对相关内容进行索引时,会遇到各种格式的内容,例如html,pdf,word等等,那么我们如何从这么文档中得到我们需要的内容哪?例如html的内容,一般我们不需要对html标签建立索引,因为那不是我们需要搜索的内容.这个时候,我们就需要从html内容中解析出我们所需要的内容.对于pdf,word文档,也是类似的要求.     总之,我们只需要从内容中提取出我们需要的文本来建立索引,这样用户就能搜索到需要的内容,然后访问对应的资源即可.   lucene本身 ...
转载:http://www.jscud.com/srun/news/viewhtml/3_2005_8/76.htm   首先,基于一个简单的新闻系统,要想做全文检索.新闻系统的管理等在这里不在具体提出,下面列出新闻对象的类:    注:程序用会到一些工具类,不在此列出,用户可以自己实现.       package com.jscud.website.newsinfo.bean;         import java.sql.timestamp; ...
  继续学习车东利用Lucene提供网站全文检索的开源项目。   由于文档不全,这次看代码看得很苦,几乎是用log4j一个类一个方法的看过来的。令人高兴的是,期间请教车东时,他说到要重新整理一下整个项目的源代码和文档,估计后来者可以轻松矣。   除了以前提到的汉化外,车东在这个项目中,加入了很多实用的东东,如反显、排序、摘要等,甚至也连网页过期时间、输出格式的限制都考虑到了。   下面是我的测试页面,大家看看先。等明天我把源代码diff一下,把我做的修改文件也挂上来,供大家参考。     在车东的简历上,有一个商业检索网址,估计是车东他们的成绩,可以去看看,也帮助理解这个项目的功能 ...
不仅仅在推广和介绍方面,车东在Lucene的汉化及web应用,也作出了极大的极大的贡献。他将自己的汉化和web应用两方面的成果,放在sourceforge上成了开源的项目。下面主要是对这个项目的学习笔记。   对Lucene的汉化,车东开发了两个Analyzer,一个是二元切分,一个单字切分。利用这两个中的任一个进行分析,都可以进行汉字的索引和检索了。我把这两个Analyzer编译后一起打入到lucene-1.2.jar中了,如果不愿自己动手进行编译这两个Analyzer的朋友,可以从这儿下载。   有了新的Analyzer,我把IndexFiles、IndexHTML和SearchFiles中 ...
0、准备工作   去Lucene的主页下载目前的稳定版本lucene-1.2.tar.gz,解压缩,将lucene-1.2目录下的两个jar文件lucene-1.2.jar和lucene-demo2-1.2.jar放到适当的目录下后,并将其加入到CLASSPATH环境变量中。   tar zxvf lucene-1.2.tar.gz <----解压缩 cd lucene-1.2 cp *.jar $DP<---存放jar文件的目录,根据具体工作要求用实际目录替换 CLASSPATH=$CLASSPATH:$DP/lucene-1.2.jar:$DP/lucene-demos-1.2 ...
Global site tag (gtag.js) - Google Analytics