锁定老帖子 主题:搜索篇:lucene简单实例<二>
精华帖 (0) :: 良好帖 (7) :: 新手帖 (0) :: 隐藏帖 (1)
|
|
---|---|
作者 | 正文 |
发表时间:2006-12-28
lighter 写道 回楼上的:
lucene不管数据来源是什么格式,只要它能被转化为文字的形式,就可以被lucene分析利用,对其进行索引和搜索.简单地说,lucene可以对任何的数据做索引和搜索,不管文件是Word,pdf格式,只要可以从中抽取文字形式的内容就可以被lucene利用啦. 可否利用它对数据库中的数据进行搜索? |
|
返回顶楼 | |
发表时间:2006-12-28
可以.
如果你使用hibernate的话,看一下3.1版本起的hb的的文档,有说到hb与lucene的结合使用.. |
|
返回顶楼 | |
发表时间:2006-12-28
Lucene是一个全文检索的核心工具包,它只关心全文检索的内核部分,对于数据源没有特别的要求,lucene有自己的数据结构Document、Field,所以无论是检索数据库、word、pdf等都不是问题,只要能转化成String流就行,至于怎么转化都没有关系。
小弟最近也在做这方面的工作,大家有什么心得也可以互相交流一下。顺便问一下有没有哪位用过“极易中文分词”--MMAnalyzer,我最近刚开始使用它,有没有用过的给点经验和评价。 |
|
返回顶楼 | |
发表时间:2007-01-14
niyong 写道 lighter 写道 回楼上的:
lucene不管数据来源是什么格式,只要它能被转化为文字的形式,就可以被lucene分析利用,对其进行索引和搜索.简单地说,lucene可以对任何的数据做索引和搜索,不管文件是Word,pdf格式,只要可以从中抽取文字形式的内容就可以被lucene利用啦. 可否利用它对数据库中的数据进行搜索? 1、将需要作索引的 table 取出來; 2、再利用 lucene 作索引,任何可以以文字形式读取的东西都可利用 lucene 作索引; 3、可以作成索引就可以查询了。 |
|
返回顶楼 | |
发表时间:2007-01-14
这一篇文章有说一些内容关于lucene的:
http://wiki.redsaga.com/confluence/display/HART/Hibernate+Lucene+Integration 可以看一下 |
|
返回顶楼 | |
发表时间:2007-03-03
对于中文的用什么Analyzer呢?刚接触啊。。。学习中
还有一点,如果网页内容都是从库中取出来的,也是用这样做吗???(也就是站内搜索,没有头绪-_-!) |
|
返回顶楼 | |