`

lucene4.9学习之信息检索基础

 
阅读更多
Lucene是一个高效的基于java的全文检索工具。
数据分为结构化数据和非结构化数据。
结构化数据用sql语句等查询,非结构化数据的检索主要用到两种方法:一是顺序扫描法,一是将非结构化数据中的一部分信息提取出来重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。
这部分从非结构化数据中提取出来的然后重新组织的信息就是索引。
这种先建立索引,再对索引进行搜索的过程就叫全文索引(Full-text Search)。
全文检索大体分两个过程,索引创建(Indexing)和搜索索引(Search)。
分享到:
评论

相关推荐

    lucene4.9全包

    Apache Lucene 是一个开源全文搜索引擎库,它为开发者提供了构建高效、可扩展的信息检索应用的基础工具。4.9 版本是 Lucene 的一个重要里程碑,引入了多项改进和新特性,以优化搜索性能和用户体验。在本文中,我们将...

    lucene4.9最全源代码

    在Java编程语言中,它提供了强大的文本搜索功能,广泛应用于各种信息检索系统。这次我们关注的是Lucene 4.9.0版本,这个版本包含了所有源代码和相关的文档,为开发者提供了学习和研究的绝佳资源。 一、Lucene的基本...

    IKAnalyzer LUCENE.4.9 中文分词的高亮显示

    它广泛应用于全文检索、信息抽取、自动文摘等领域。而Apache Lucene则是一个高性能、全文本搜索库,为开发者提供了完整的搜索功能。 标题"IKAnalyzer LUCENE.4.9 中文分词的高亮显示"表明我们将探讨如何使用IK...

    lucene笔记

    Lucene是一个由Apache基金会维护的开源全文检索引擎工具包。它为开发者提供了一个简便的接口,使得在应用程序中实现高效的全文检索功能成为可能。Lucene不仅仅是一个简单的搜索工具,而是一个完整的搜索引擎开发平台...

    solr4.9+tomcat+zookeeper集群

    Solr是Apache Lucene项目的一个子项目,是一个高性能、全文本搜索服务器,广泛应用于各种大数据检索场景。在4.9版本中,Solr引入了集群功能,以支持高可用性和可扩展性。在这个集群环境中,Tomcat作为Servlet容器...

    Lucene简单使用需要的jar

    Lucene是Apache软件基金会的一个开放源代码项目,它是一个高性能、全文本检索库,提供了索引和搜索功能。作为一个底层库,它并不直接提供用户界面,但可以被集成到各种应用程序中,如网站、桌面应用等,以实现强大的...

    【分享:lucene学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>

    1&gt; lucene学习笔记 2&gt; 全文检索的实现机制 【1】lucene学习笔记的目录如下 1. 概述 3 2. lucene 的包结构 3 3. 索引文件格式 3 4. lucene中主要的类 4 4.1. Document文档类 4 4.1.1. 常用方法 4 4.1.2. 示例 4 4.2...

    Lucene 测试需要的jar 包

    Lucene 是一个高性能、全文本检索库,由Apache软件基金会开发。它提供了强大的搜索功能,被广泛用于各种项目,从网站搜索引擎到企业级内容管理系统。这个压缩包包含了一系列必要的jar包,是进行Lucene测试的基础。 ...

    solr4.9安装使用手册

    Solr 4.9.0 是一款开源的全文搜索引擎服务器,由Apache软件基金会开发,它在企业级搜索应用中广泛使用。本安装使用手册旨在帮助...通过不断学习和实践,你可以更好地掌握Solr的精髓,从而实现更高效的全文检索功能。

    solr-4.9.0-安装部署文档

    Apache Solr 是一款基于 Lucene 的开源搜索引擎,广泛用于企业级的数据检索、全文搜索和数据分析。本文将详细讲解如何在 Windows 7 64 位旗舰版上安装并部署 Solr 4.9.0 版本。 1. **准备环境和软件** - 首先,...

Global site tag (gtag.js) - Google Analytics