`
sunqi
  • 浏览: 230110 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Lucene开发中的总结

阅读更多
  1、Lucene搜索结果排序和sql排序结果不一致
  系统的原因导致部分使用Lucene搜索而部分使用sql查询,但两者搜索出来的结果中文排序不相同,在使用了Locale语言设置CHINESE、SIMPLIFIED_CHINESE、CHINA等,生僻字的排序仍旧是不一样。
  2、Lucene搜索结果排序问题
  对于数据量大的索引,不要用索引中的字段排序,要用索引ID排序(INDEXORDER);两者效率相差近10倍。
  3、搜索结果按时间排序
  为了能够使索引ID倒序等同于时间倒序:在建立索引时,就要按照数据的时间顺序建立,老的数据先索引,新的数据后索引,当然这是在按照生成时间排序,如果修改时间排序,那就标识原来索引为删除再追加索引
  4、特殊字符串查询
  Lucene支持转义特殊字符,因为特殊字符是查询语法用到的。转义特殊字符我们可以使用符号“\”放于字符之前。比如我们要搜索(1+1):2,我们可以使用如下语法:
\(1\+1\)\:2

其他待续....
分享到:
评论

相关推荐

    Lucene开发手册

    【Lucene开发手册】 Lucene是一个开源的全文检索库,由Apache软件基金会开发,主要用Java编写。作为一套API,Lucene提供了构建高效、可扩展的搜索引擎所需的核心工具。它并非一个完整的搜索引擎产品,而是一个搜索...

    Lucene原理及使用总结

    Lucene最初由Doug Cutting开发,并且现在是Apache软件基金会Apache Jakarta项目的一部分,可以在官方网站http://lucene.apache.org/上获取最新版本。Lucene的主要特点是它的高效性和灵活性,使得开发者能够快速构建...

    使用lucene进行简单的开发

    总结,这个简单的Lucene开发示例展示了如何将数据库中的数据构建为Lucene索引,以及如何使用这些索引执行搜索。在实际应用中,可能还需要考虑更复杂的查询逻辑、优化性能、错误处理等其他方面。随着对Lucene的深入...

    lucene开发WEB搜索引擎

    总结,利用LUCENE.NET开发WEB搜索引擎是一项技术含量高的工作,涉及到数据爬取、文本处理、索引构建、搜索算法等多个环节。通过深入理解和实践,开发者可以构建出高效、灵活的搜索引擎,满足不同场景的需求。

    Lucene2.4入门总结

    Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了高级文本检索功能,广泛用于构建搜索引擎和其他需要高效全文检索能力的应用。本文将重点介绍 Lucene 2.4 版本的基本概念和使用方法,帮助...

    Lucene关于几种中文分词的总结

    《Lucene关于几种中文分词的总结》 在搜索引擎和信息检索系统中,中文分词是文本处理的关键步骤。Lucene作为一款强大的全文检索库,虽然内置了StandardAnalyzer,但其对中文分词的支持并不完全满足所有应用需求。...

    lucene 的开发包6.6

    三、使用Lucene开发流程 1. 创建索引:首先,需要实例化一个Directory对象,如FSDirectory,然后使用IndexWriter创建索引。通过Field添加文档字段,并调用addDocument方法将文档添加到索引。 2. 查询索引:使用...

    lucene 搜索中文PDF文档

    Lucene是一个强大的全文搜索引擎库,由Apache软件基金会开发并维护,广泛应用于各种文本检索和信息检索系统。在本篇文章中,我们将深入探讨如何使用Lucene来搜索中文PDF文档,以及在这个过程中可能遇到的关键技术和...

    heritrix+lucene开发资料

    Heritrix和Lucene是两个在信息技术领域中用于搜索引擎开发的重要工具。Heritrix是一个开源的网络爬虫,用于抓取互联网上的网页信息,而Lucene则是一个高性能、全文本搜索库,常被用于构建复杂的搜索系统。接下来,...

    nutch+lucene开发自己的搜索引擎ch3.pdf

    ### nutch+lucene开发自己的搜索引擎知识点总结 #### 一、概览 - **标题与描述**: 本资料“nutch+lucene开发自己的搜索引擎ch3.pdf”聚焦于介绍如何使用Nutch和Lucene来构建自己的搜索引擎,特别强调了第三章:...

    lucene学习总结

    **Lucene学习总结** 在深入理解Lucene之前,我们首先需要了解什么是全文检索。全文检索是一种从大量文本数据中快速查找所需信息的技术。它通过建立索引来实现高效的搜索,而Lucene正是Java环境下最著名的全文搜索...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    在《开发自己的搜索引擎》一书中,通过`ch2-lucene入门小例子`,读者可以了解到如何使用Lucene 2.0创建简单的搜索引擎,例如建立索引、执行搜索等基本操作。而`myReserch-可用的网络搜索引擎`可能包含一个完整的搜索...

    lucene+中文IK分词器 例子

    在开始之前,确保已安装Java开发环境,并在项目中引入Lucene和IK分词器的相关依赖。对于Lucene 3.5,可能需要导入如下的Maven依赖: ```xml <groupId>org.apache.lucene <artifactId>lucene-core <version>...

    lucene 中文分词 庖丁解牛

    其中,Apache Lucene作为一个开源的全文检索库,被广泛应用于各种项目中,尤其对于处理中文文本,分词是其关键的一环。本文将深入探讨如何在Lucene中高效地进行中文分词,借助“庖丁解牛”的概念,以求在理解与应用...

    开发自己的搜索引擎 lucene + heritrix

    总结来说,开发一个基于Lucene和Heritrix的搜索引擎是一个涉及多种技术和步骤的复杂过程。理解Lucene和Heritrix的工作原理和使用方法,以及如何将两者结合构建有效的搜索引擎,对于完成这项工作至关重要。同时,针对...

    Lucene.net概念介绍

    通过 Lucene.net,开发人员可以轻松地在 .NET 应用程序中集成全文搜索功能,从而提升应用的用户体验和数据查找效率。 1. Lucene 简介: - Lucene 本身是一个开源的全文搜索框架,它不直接作为一款应用产品使用,...

    基于Lucene的Lucene

    本篇文章将深入探讨如何基于Lucene开发一个文件检索系统,以及如何扩展其功能以支持多种文件格式。 ### Lucene核心概念 1. **索引(Index)**: 在Lucene中,索引是将非结构化的文本数据转换为结构化的倒排索引的...

Global site tag (gtag.js) - Google Analytics