Lucene分页查询

wcdzxxgc

浏览: 84183 次
性别:
来自: 武汉

最近访客更多访客>>

will_zhuzhu2

xuyongff

冷月宫主

dreamguyzf

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

lucene

个人认为最好每一次分页导航都执行一次新的查询。

Lucene旧版本中常用方法：
Hits中保存的并不是真正的Document，因此可以通过HIts.doc(index)的方式取出在一定范围内的Document。在获得Hits后可以用类似下面的方法进行分页处理：

private List processHits(Hits hits,int startIndex,int endIndex)throws Exception{

if(endIndex>=hits.length())

endIndex=hits.length()-1;

List docs=new ArrayList();

for(int i=startIndex;i<=endIndex;i++){

Document doc=hits.doc(i);

Map docMap=new HashMap();

docMap.put(”id”,doc.getField(”id”).stringValue());

docMap.put(”name”,doc.getField(”name”).stringValue());

docMap.put(”price”,doc.getField(”price”).stringValue());

docs.add(docMap);

}

return docs;

}

这里可以按自己的需要重新封装Document和Field的数据。startIndex和endIndex标定了当前页面的范围。

Lucene新版本中Hits已经被弃用，代替它的是TopDocs，具体分页查询的方法为：

    TopDocs topDocs=indexSearcher.search(query, 10000);
    ScoreDoc[] scoreDocs=topDocs.scoreDocs;                  
    //存储符合条件的记录
    ArrayList<String> list=new ArrayList<String>();
    for (int i = startIndex;i < endIndex&&i<topDocs.totalHits; i++) {
            	
            Document document=indexSearcher.doc(scoreDocs[i].doc);
            list.add(document.getField("id").stringValue());
    }

4
顶

0
踩

分享到：

java对象复制 | 文件中关键词检索

2009-11-20 10:01
浏览 13443
评论(6)
分类:编程语言
查看更多

6 楼 2047699523 2015-04-28

apache lucene开源框架demo使用实例教程源代码下载:http://www.zuidaima.com/share/klucene-p1-s1.htm

5 楼 diyunpeng 2012-11-30

楼主现在有什么办法么？
譬如我现在索引库为300数据，我想搜做最后1000条中满足条件的。

4 楼 gtt232 2012-06-08

gdsfgsdfg

3 楼 ppm10103 2012-05-15

Deep Paging Support. Added IndexSearcher.searchAfter which returns results after a specified ScoreDoc. You can pass the last document on the previous page to the searchAfter method to get to the next page of results

2 楼 wcdzxxgc 2011-03-31

zk1878 写道

   1. TopDocs topDocs=indexSearcher.search(query, 10000);
   2. ScoreDoc[] scoreDocs=topDocs.scoreDocs;
   3. //存储符合条件的记录
   4. ArrayList<String> list=new ArrayList<String>();
   5. for (int i = startIndex;i < endIndex&&i<topDocs.totalHits; i++) {
   6.
   7.         Document document=indexSearcher.doc(scoreDocs[i].doc);
   8.         list.add(document.getField("id").stringValue());
   9. }
这个分页真能分？
假如结果集有1千万条数据
我从第300万开始，查询1千条数据
TopDocs topDocs=indexSearcher.search(query, 10000); 这句代码的第二个参数取值就成问题了，当然如果你取很大，会不会内存溢出，不够大那startIndex就数组越界了
当然我这里是钻牛角尖了，只是我感觉没有一个完美的方案，所以问问

这个问题之前考虑过，但是的确没有一个完美的方法，先只能这样用了，看有没有其它人提出更好的办法

1 楼 zk1878 2011-03-02

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论