`
wcdzxxgc
  • 浏览: 83801 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Lucene分页查询

    博客分类:
  • Java
阅读更多
个人认为最好每一次分页导航都执行一次新的 查询。

Lucene旧版本中常用方法:
Hits中保存的并不是真正的Document,因此可以通过HIts.doc(index)的方式取出在一定范围内的Document。在获 得Hits后可以用类似下面的方法进行分页处理:

private List processHits(Hits hits,int startIndex,int endIndex)throws Exception{

if(endIndex>=hits.length())

endIndex=hits.length()-1;

List docs=new ArrayList();

for(int i=startIndex;i<=endIndex;i++){

Document doc=hits.doc(i);

Map docMap=new HashMap();

docMap.put(”id”,doc.getField(”id”).stringValue());

docMap.put(”name”,doc.getField(”name”).stringValue());

docMap.put(”price”,doc.getField(”price”).stringValue());

docs.add(docMap);

}

return docs;

}


这里可以按自己的需要重新封装Document和Field的数据。startIndex和endIndex标定了当前页面的范围。

Lucene新版本中Hits已经被弃用,代替它的是TopDocs,具体分页查询的方法为:
    TopDocs topDocs=indexSearcher.search(query, 10000);
    ScoreDoc[] scoreDocs=topDocs.scoreDocs;                  
    //存储符合条件的记录
    ArrayList<String> list=new ArrayList<String>();
    for (int i = startIndex;i < endIndex&&i<topDocs.totalHits; i++) {
            	
            Document document=indexSearcher.doc(scoreDocs[i].doc);
            list.add(document.getField("id").stringValue());
    }
4
0
分享到:
评论
6 楼 2047699523 2015-04-28  
apache lucene开源框架demo使用实例教程源代码下载:http://www.zuidaima.com/share/klucene-p1-s1.htm
5 楼 diyunpeng 2012-11-30  
楼主现在有什么办法么?
譬如我现在索引库为300数据,我想搜做最后1000条中满足条件的。
4 楼 gtt232 2012-06-08  
gdsfgsdfg
3 楼 ppm10103 2012-05-15  
Deep Paging Support. Added IndexSearcher.searchAfter which returns results after a specified ScoreDoc. You can pass the last document on the previous page to the searchAfter method to get to the next page of results
2 楼 wcdzxxgc 2011-03-31  
zk1878 写道
   1. TopDocs topDocs=indexSearcher.search(query, 10000); 
   2. ScoreDoc[] scoreDocs=topDocs.scoreDocs;                   
   3. //存储符合条件的记录 
   4. ArrayList<String> list=new ArrayList<String>(); 
   5. for (int i = startIndex;i < endIndex&&i<topDocs.totalHits; i++) { 
   6.              
   7.         Document document=indexSearcher.doc(scoreDocs[i].doc); 
   8.         list.add(document.getField("id").stringValue()); 
   9. } 
这个分页真能分?
假如结果集有1千万条数据
我从第300万开始,查询1千条数据
TopDocs topDocs=indexSearcher.search(query, 10000);  这句代码的第二个参数取值就成问题了,当然如果你取很大,会不会内存溢出,不够大那startIndex就数组越界了
当然我这里是钻牛角尖了,只是我感觉没有一个完美的方案,所以问问



这个问题之前考虑过,但是的确没有一个完美的方法,先只能这样用了,看有没有其它人提出更好的办法
1 楼 zk1878 2011-03-02  
   1. TopDocs topDocs=indexSearcher.search(query, 10000); 
   2. ScoreDoc[] scoreDocs=topDocs.scoreDocs;                   
   3. //存储符合条件的记录 
   4. ArrayList<String> list=new ArrayList<String>(); 
   5. for (int i = startIndex;i < endIndex&&i<topDocs.totalHits; i++) { 
   6.              
   7.         Document document=indexSearcher.doc(scoreDocs[i].doc); 
   8.         list.add(document.getField("id").stringValue()); 
   9. } 
这个分页真能分?
假如结果集有1千万条数据
我从第300万开始,查询1千条数据
TopDocs topDocs=indexSearcher.search(query, 10000);  这句代码的第二个参数取值就成问题了,当然如果你取很大,会不会内存溢出,不够大那startIndex就数组越界了
当然我这里是钻牛角尖了,只是我感觉没有一个完美的方案,所以问问

相关推荐

    Lucene5学习之分页查询

    本文将深入探讨"Lucene5学习之分页查询"这一主题,结合给定的标签"源码"和"工具",我们将讨论如何在Lucene5中实现高效的分页查询,并探讨其背后的源码实现。 首先,理解分页查询的重要性是必要的。在大型数据集的...

    lucene查询工具类和IndexSearcher分页查询示例

    在本文中,我们将深入探讨如何使用Lucene查询工具类和`IndexSearcher`进行分页查询,这在处理大量数据时尤其有用。Lucene是一个强大的全文搜索引擎库,它提供了高效、可扩展的文本检索功能。在Java开发环境中,...

    lucene查询结果集分页代码

    在lucene搜索分页过程中,可以有两种方式 一种是将搜索结果集直接放到session中,但是假如结果集非常大,同时又存在大并发访问的时候,很可能造成服务器的内存不足,而使服务器宕机 还有一种是每次都重新进行搜索,这样...

    自己写的lucene分页高亮显示代码

    本压缩包中的代码着重展示了如何使用 Lucene 进行分页搜索和结果高亮显示。下面将详细解释这两个关键知识点。 **一、Lucene 分页搜索** 在大型数据集上进行搜索时,一次性返回所有结果并不实际,因此分页搜索显得...

    Lucene.net建立索引,检索分页Demo

    **Lucene.net 知识点详解** Lucene.net 是 Apache Lucene 的 .NET 版本,...以上就是关于 Lucene.net 建立索引、检索及分页的关键知识点。理解并熟练运用这些概念,可以帮助开发者构建高效、灵活的全文搜索解决方案。

    lucene的查询语法事例

    - **分页 (Paging)**:通过设置`start`和`rows`参数实现分页查询,避免一次性加载大量结果导致性能下降。 总结,Lucene的查询语法是其强大功能的核心,理解和掌握这些概念及技巧,能够帮助我们构建更高效、精准的...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--dic

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--news.part2

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    lucene第一步---6.分页

    在IT行业中,Lucene是一个非常重要的全文搜索引擎...通过深入理解Lucene的索引机制和查询接口,我们可以灵活地实现分页,为用户提供流畅的搜索体验。在实践中,不断优化和调整策略,将使你的Lucene应用更加成熟和完善。

    对内存中Lucene查询的集合进行分页

    这篇博客文章“对内存中Lucene查询的集合进行分页”探讨的是如何在处理大量数据时,有效地对Lucene查询结果进行分页显示,以提高用户体验并减轻服务器负担。 首先,理解Lucene的基本工作原理至关重要。Lucene通过...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--data

    综上所述,这个项目展示了如何利用SSH框架与Lucene搜索引擎技术,实现一个功能完备的新闻搜索系统,包括高效搜索、结果排序、分页展示以及关键词高亮等特性。这样的系统对于提升新闻网站的用户体验具有重要意义。

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part1

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--news.part1

    SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part3 SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎--NewsWithSearch.part2 SSH + Lucene + 分页 + 排序 + 高亮 ...

    lucene的排序过滤和分页.zip

    本资料主要探讨了Lucene中的排序、过滤和分页技术,这些都是构建高效、实用的信息检索系统的重要组成部分。 **排序(Sorting)** 排序是Lucene中的一项核心功能,允许我们根据文档的某个或多个字段来对搜索结果...

    PHP中 对es中的数据分页 查询

    本文将详细探讨在PHP中如何对Elasticsearch(ES)中的数据进行分页查询,以及相关的封装技巧。 首先,我们需要理解Elasticsearch的数据分页原理。在ES中,分页主要通过两个参数实现:`from` 和 `size`。`from` 参数...

    lucene实现索引查询

    以下是关于使用Lucene实现索引查询的详细知识: ### 一、创建索引 创建索引是Lucene的核心过程,它涉及到以下步骤: 1. **定义索引目录**:首先,你需要指定一个目录来存储索引文件。这通常是一个文件夹,可以...

    Lucene分词与查询详解

    **Lucene分词与查询详解** Lucene是一个高性能、全文本搜索库,广泛应用于各种搜索引擎的开发中。它提供了一套强大的API,用于索引文本数据,并执行复杂的查询操作。在深入理解Lucene的分词与查询机制之前,我们...

Global site tag (gtag.js) - Google Analytics