最新文章列表

使用Lucene进行全文检索

Scud(飞云小侠) http://www.jscud.com 转载请注明来源/作者 关键字:lucene,html parser,全文检索,IndexReader,Document,Field,IndexWriter,Term,HTMLPAGE  无论是建立索引还是分析内容,都是为了用户的搜索服务.    在Lucene中,如果需要使用搜索,需要使用Searcher类,这是一个抽象类,它有2个子 ...
zhao 评论(0) 有1950人浏览 2007-01-08 22:06

<转>计算机方面期刊

straggler 2004-02-08 00:00 http://www.readfree.net/bbs/simple/t18908.html       ...
laorer 评论(0) 有3141人浏览 2006-12-26 20:04

Lucene RAMDirectory 慎用

今天一哥们在做一个程序的时候使用了Lucene做全文检索工具,但是遇到了一个问题:首先就是检索速度非常的慢,而且只要连续检索三四次,程序马上就 ...
karlmax 评论(5) 有6252人浏览 2006-12-24 23:33

Lucene-2.0学习文档(1)

  [原创]Lucene-2.0学习文档 作者:Javafish(likunkun) Email:javafish@sunxin.org Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的 ...
likunkun 评论(16) 有12057人浏览 2006-12-21 00:23

搜索篇:lucene简单实例<二>

写文章的时候,感觉比较难写的就是标题,有时候不知道起什么名字好,反正这里写的都是关于lucene的一些简单的实例,就随便起啦. Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入 ...
lighter 评论(15) 有10761人浏览 2006-12-20 23:09

全文检索应用插件

       用了一周多的时间学习全文检索引擎Lucene,同时利用RCP框架构建了一个基于Lucene的桌面检索引擎,因为只是处于学习目的,对实际的功能考虑的不多,目前可以搜索word、pdf、html和普通的文本文件,实际使用的技术除RCP外还有用于读取word文件的POI和读取pdf的PDFBOX,做到后来发现最难处理的是网页文件和mht文件,这里只是当成普通文本来处理了,而在实际的处理过程中 ...
drnstar 评论(1) 有1474人浏览 2006-12-20 01:10

Blog建站程序BlogMethods发布Basic 1.0.0版

BlogMethods Basic 1.0.0发布,一个新的Blog建站程序加入了竞争。从介绍来看,这款Blog建站程序的特点包括: Gmail风格的后台管理界面和基于Ajax技术的用户 ...
withyou 评论(0) 有899人浏览 2006-12-13 00:33

全文检索

全文检索:是指计算机索引程序通过扫描字符文件中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
huangxilong 评论(0) 有1404人浏览 2006-12-12 15:56

<转>海量数据库的查询优化及分页算法方案

  海量数据库的查询优化及分页算法方案 出处:CSDN ...
laorer 评论(0) 有1301人浏览 2006-12-12 13:26

配置WebLogic Tuxedo Connector (转)

WebLogic Tuxedo Connector (WTC) 是一个兼容 JCA ( J2EE 连接器架构)的软件组件,它提供 Tuxedo 服务和 WebLogic Server 部署的企业应用程序之间的互操作性。 WebLogic ...
Eric_liu 评论(0) 有3827人浏览 2006-12-05 15:36

lucene 入门(转)

Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文 ...
youngbean 评论(0) 有3833人浏览 2006-11-03 18:14

Jive学习心得

Jive学习心得 一. 设计模式 1. 工厂模式:    它主要是为创建对象提供了一种接口(此处的接口为要创建对象的接口),工厂模式主要是封装了创建 ...
hgx615 评论(1) 有2039人浏览 2006-10-28 10:00

JavaEye积分规则,博客和论坛使用规则

积分规则 一、会员等级 1、新手 上路和发贴要求    1)新注册用户,在一天之内是新手 上路,在一天之内,不可以发贴,不可以发送站内短信,不可以对其他人的帖子评分;    2)JavaEye的招聘是收费服务,发招聘贴请和管理员联系,否则隐藏; 2、初级会员 新注册用户在一天以后,自动转为初级会员。初级会员可以使用博客,可以发贴,可以发送站内短信。 3、1-5星会员,1-5钻会员 按照会员 ...
ITeye管理员 评论(1) 有96089人浏览 2006-10-23 20:56

Ferret

Ferret http://ferret.davebalmain.com/trac Full text search in Ruby on Rails http://blog.zmok.net/articles/2006/08/14/full-text-search-in-ruby-on-rails http://blog.zmok.net/articles/2006/09/04/full-tex ...
xxj 评论(0) 有1691人浏览 2006-10-23 10:17

复杂商品分类的表如何建立?

复杂商品的分类,类似淘宝的分类 1.每类商品有无限级分类 2.每个商品可能会有交叉分类 3.每类商品的扩展属性不一样 比如: 夹克的扩展属性为 款式: 拉链夹克 风格: 休闲 品牌: other/其它 适合季节: 春秋 尺码: M L 颜色: 其它颜色 质地: 纯棉 主板的扩展属性为 品牌: 微星/MSI 类型: Socket478 芯片组: Intel 845 平台类型: Intel平台 宝贝成色 ...
zww80216 评论(23) 有11944人浏览 2006-10-10 17:59

下一代搜索技术的四块积木

按照我的设想,下一代Internet搜索技术,应该由以下四个部分组成:   一、以互联网搜索为核心的网络资源搜索。   现在最常见的搜索工具,Google、百度、Yahoo、MSN Search之类的,都属于这个范畴。再加上今后会出现的越来越多的各种专业信息搜索,比如论文、文献、MP3、BT、RSS等等搜索工具。   二、以桌面搜索为核心的个人资源搜索。   现在的桌面搜索工具还刚刚起步,今 ...
庄表伟 评论(0) 有965人浏览 2006-08-13 20:41

lucene原理

Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives i ...
mhbjava 评论(0) 有2049人浏览 2006-07-12 10:27

当前状态, WoW开发计划

后来这些天写TOB的资料和教程, 本来是打算写个简单的蓝图应用, 也做教程的示例, 不过架构下来发现又有很多可以突破传统, 值得好好做做的东西.   这个蓝图应用名字基本定为 WebOfWeb (WoW), 大体上是用类似MindMapping(参考: http://freemind.sf.net, Web发布示例(需要JRE1.4以后): http://www.ableverse.org/cop. ...
歆渊 评论(0) 有1561人浏览 2006-04-15 18:25

小结

上一周一直在做全文检索,做个小结:一:关于Lucene    这个没什么可说的了,有什么问题看Lucene in Action,要是还没能解答问题,请教mail-list二:万恶的LOB    我的情况:JDK1.3.1,本地测试是oracle的驱动,测试机上是weblogic的驱动,必须在提交的时候手工改为  OutputStream out =(( weblogic.jdbc.comm ...
xxj 评论(0) 有1079人浏览 2006-02-28 09:58

构想:Google桌面搜索、Delicious、知识管理

先介绍两个软件:Google桌面搜索和DeliciousGoogle桌面搜索Google搜索大家都熟悉,Google桌面搜索是Google搜索的桌面版本(请看http://desktop.google.com)。Google桌 ...
lane_cn 评论(0) 有1263人浏览 2005-08-15 12:38

最近博客热门TAG

应用服务器(43285) Spring(40811) Hibernate(33329) Tomcat(28344) 框架(27200) 设计模式(24055) Servlet(23313) Struts(22804) Bean(22194) 企业应用(18268) thread(15825) 多线程(14800) SUN(11436) 虚拟机(11382) Cache(11314) Security(8001) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics