最新文章列表

值得关注的开源项目

J2EE框架 Spring Framework Spring提供了管理业务对象的一致方法并且鼓励了注入对接口编程而不是对类编程的良好习惯。Spring的架构基础是基于使用JavaBean属性的Inversion of Control容器。Spring提供了唯一的数据访问抽象,包括简单和有效率的JDBC框架,极大的改进了效率并且减少了可能的错误。Spring的数据访问架构还集成了Hibernat ...
apple 评论(0) 有2063人浏览 2007-01-10 13:19

使用Lucene进行全文检索

Scud(飞云小侠) http://www.jscud.com 转载请注明来源/作者 关键字:lucene,html parser,全文检索,IndexReader,Document,Field,IndexWriter,Term,HTMLPAGE  无论是建立索引还是分析内容,都是为了用户的搜索服务.    在Lucene中,如果需要使用搜索,需要使用Searcher类,这是一个抽象类,它有2个子 ...
zhao 评论(0) 有1910人浏览 2007-01-08 22:06

搜索引擎学习资源收集

一、搜索引擎技术/动态资源 <一>、综合类 1、卢亮的搜索引擎研究    [URL=http://www.wespoke.com/][/URL]http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"([URL=http://booso.com/][/URL]http://booso.com/),好像现在已经停止开发 ...
lmx800 评论(0) 有2815人浏览 2007-01-08 18:32

Nutch搜索引擎分析

21世纪是信息的时代,也是网络的时代。不断通畅与进步的互联网在给人们带来浩如烟海的网络信息的同时,也容易使人在查询自己所需的有用的相关信 ...
lmx800 评论(0) 有2174人浏览 2007-01-07 10:31

Apache Solr 剖析系列(1)

本文是Apache Solr介绍的姊妹篇,我将逐一分析Apache Solr的各个包,力图详细地分析Solr的设计和架构。Apache Solr由12个包组成,如下: org.apache.solr.analysis org.apache.solr.core org.apache.solr.request org.apache.solr.schema org ...
alartin 评论(3) 有7418人浏览 2007-01-04 18:02

Lucene之Field

doc.add(new Field("file",file.getName(),Field.Store.YES,Field.Index.NO)); //doc.add(Field.UnIndexed("file", file.getName())); 后者在lucene的后续版本中找不到了,可能是被抛弃的方法吧.现在用上面的方法代替. org.apache. ...
weishuwei 评论(1) 有4553人浏览 2007-01-04 16:49

Apache Solr 介绍(1)

导言 说起Apache Lucene,可以说无人不知,无人不晓,但是说道Apache Solr,恐怕知道的不多。看看Apache Solr的说明: Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servlet ...
alartin 评论(6) 有37608人浏览 2007-01-03 15:07

Lucene:怎样判断一个文件是否已经被创建了索引

我是刚刚学习Lucene的新手,现在遇到这个问题,在这里请教各位高手,谢谢!
Rok 评论(1) 有1732人浏览 2007-01-02 11:46

lucene中文分词组件共享

IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的 正反向全切分 以及 正反向最大匹配切分 两种算法,是Lucene Analyzer接口的实现,代码使用例子如下:下载地址:Lucene中文分词器 V1.2 CSDN下载Lucene中文分词器 V1.2 Google下载正反向全切分算法:实现类 : org.mira.lucene.analysis.IK_CAnalyz ...
linliangyi2007 评论(2) 有3898人浏览 2006-12-27 13:58

Lucene RAMDirectory 慎用

今天一哥们在做一个程序的时候使用了Lucene做全文检索工具,但是遇到了一个问题:首先就是检索速度非常的慢,而且只要连续检索三四次,程序马上就 ...
karlmax 评论(5) 有6239人浏览 2006-12-24 23:33

昨日网摘 [2006-12-24:anux @ del.icio.us]

ferret - TracFerret is a high-performance, full-featured text search engine library written for Ruby. It is inspired by Apache Lucene Java project.《商业周刊》 创新在中国障碍与生俱来计划生育政策下出生的一代人正成为大学生的主要力量,他们要求不同以往的设施 ...
alang 评论(0) 有1108人浏览 2006-12-23 16:00

关于Lucene 做全文搜索的问题,个站:http://mao52.com

最近正在做全文搜索。 问题是我新增索引后,旧的索引文件不能删除? 建索引代码如下: Directory directory;         IndexWriter writer;         CWordAnalyzer analyzer=new CWordAnalyzer();         directory = FSDirectory.getDirectory(indexFilePath ...
mao_lu 评论(3) 有2542人浏览 2006-12-21 15:57

Lucene-2.0学习文档(4)

接http://www.iteye.com/topic/39876 下面是搜索的例子: [code] public void SearchSort1() throws IOException, ParseException {         IndexSearcher indexSearcher = new IndexSearcher(" ...
likunkun 评论(4) 有7086人浏览 2006-12-21 00:38

Lucene-2.0学习文档(3)

接http://www.iteye.com/post/190335 到现在我们已经可以用lucene建立索引了 下面介绍一下几个功能来完善一下: 1.索引格式 其实索引目录有两种格式,一种是除配置文件外,每一个Document独立成为一个文件(这种搜索起来会影响速度)。另一种是全部的Document成一个文件,这样属于复合模式就快了。 2.索引文件可放的位置: 索引可以存放在两个地方1.硬盘,2.内 ...
likunkun 评论(7) 有6517人浏览 2006-12-21 00:35

全文检索应用插件

       用了一周多的时间学习全文检索引擎Lucene,同时利用RCP框架构建了一个基于Lucene的桌面检索引擎,因为只是处于学习目的,对实际的功能考虑的不多,目前可以搜索word、pdf、html和普通的文本文件,实际使用的技术除RCP外还有用于读取word文件的POI和读取pdf的PDFBOX,做到后来发现最难处理的是网页文件和mht文件,这里只是当成普通文本来处理了,而在实际的处理过程中 ...
drnstar 评论(1) 有1447人浏览 2006-12-20 01:10

关于Hibernate3的escape解决方法

不知道大家有没有碰到,还是没有这种需求。就是用like来查询,我们没有用Lucene,Compass这种全文索引的方案,我们只是简单的添加%进行like查询。用户搜索的时候就使用*和?来代表任意和一个。所以要对"%"和"_"进行转义,我们使用的是oracle数据库。sql语句看起来可能是这样的。SELECT * FROM t_user where nickna ...
somebody 评论(0) 有1976人浏览 2006-10-16 15:29

Lucene2.0简单例子

package gt.test.lucene; import java.io.IOException; import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document; ...
Goodtiger 评论(0) 有1485人浏览 2006-08-10 13:38

&#34;Ajax+Lucene构建搜索引擎&#34;

先看其中的Lucene部分,等看完了有时间的时候再去看Ajax的部分这里面的Lucene的代码都是1.4.3版本的,但是我就要用2.0的包就边看边把所有的代码都移植到2.0版本里面去熟悉了代码,而且也熟悉了2.0和1.4.3版本中不一样的地方看完之后再写总结吧 类别:Lucene 查看评论
Goodtiger 评论(0) 有1068人浏览 2006-08-08 16:02

Lucene实践计划

1) 编写 Java 程序 MyIndexer.java,使用 JDBC 取出 MySQL 数据表内容,然后通过 org.apache.lucene.index.IndexWriter 创建索引。2) 编写 Java 程序 MySearcher.java,通过 org.apache.lucene.search.IndexSearcher 等查询索引。3) 实现支持中文查询及检索关键字高亮显示。 ...
Goodtiger 评论(0) 有1208人浏览 2006-07-20 16:15

Compass读文档笔记

Compass读文档笔记 Compass是基于Lucene 的更高层的抽象,假如你正打算做关于搜索方面的模块的话,那我建议你使用Compass,他提供了可配置方案,而且比Lucene更加容易使用。如果你的系统中使用Spring, Hibernate,JDO, IBatis。。。 Compass是最好的选择,他能够非常方便的集成到现有系统中去。 ...
ruruhuang 评论(0) 有2398人浏览 2006-07-06 16:00

最近博客热门TAG

Apache(33931) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics