论坛首页 Java企业应用论坛

搜索篇:lucene简单实例<二>

浏览 49508 次
精华帖 (0) :: 良好帖 (7) :: 新手帖 (0) :: 隐藏帖 (1)
作者 正文
   发表时间:2006-12-28  
lighter 写道
回楼上的:
lucene不管数据来源是什么格式,只要它能被转化为文字的形式,就可以被lucene分析利用,对其进行索引和搜索.简单地说,lucene可以对任何的数据做索引和搜索,不管文件是Word,pdf格式,只要可以从中抽取文字形式的内容就可以被lucene利用啦.


可否利用它对数据库中的数据进行搜索?
0 请登录后投票
   发表时间:2006-12-28  
可以.
如果你使用hibernate的话,看一下3.1版本起的hb的的文档,有说到hb与lucene的结合使用..
0 请登录后投票
   发表时间:2006-12-28  
Lucene是一个全文检索的核心工具包,它只关心全文检索的内核部分,对于数据源没有特别的要求,lucene有自己的数据结构Document、Field,所以无论是检索数据库、word、pdf等都不是问题,只要能转化成String流就行,至于怎么转化都没有关系。
小弟最近也在做这方面的工作,大家有什么心得也可以互相交流一下。顺便问一下有没有哪位用过“极易中文分词”--MMAnalyzer,我最近刚开始使用它,有没有用过的给点经验和评价。
0 请登录后投票
   发表时间:2007-01-14  
niyong 写道
lighter 写道
回楼上的:
lucene不管数据来源是什么格式,只要它能被转化为文字的形式,就可以被lucene分析利用,对其进行索引和搜索.简单地说,lucene可以对任何的数据做索引和搜索,不管文件是Word,pdf格式,只要可以从中抽取文字形式的内容就可以被lucene利用啦.


可否利用它对数据库中的数据进行搜索?


1、将需要作索引的 table 取出來;
2、再利用 lucene 作索引,任何可以以文字形式读取的东西都可利用 lucene 作索引;
3、可以作成索引就可以查询了。
0 请登录后投票
   发表时间:2007-01-14  
这一篇文章有说一些内容关于lucene的:
http://wiki.redsaga.com/confluence/display/HART/Hibernate+Lucene+Integration
可以看一下
0 请登录后投票
   发表时间:2007-03-03  
对于中文的用什么Analyzer呢?刚接触啊。。。学习中
还有一点,如果网页内容都是从库中取出来的,也是用这样做吗???(也就是站内搜索,没有头绪-_-!)
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics