`
qzxfl008
  • 浏览: 78575 次
  • 性别: Icon_minigender_1
  • 来自: 浙江
社区版块
存档分类
最新评论

lucene ——全文检索

阅读更多
    在讲全文检索之前,先说下信息检索。
    信息检索通俗的讲,就是从信息集合中找出与用户相关的信息,除了文本之外,还有音频、图像等。
    全文检索:把用户的查询请求和全文中的每个词进行比较,不考虑查询请求与文本语义上的匹配。
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
来自
引用
http://www.lucene.com.cn/about.htm#_Toc43005313





lucene可以视为开发接口左边部分



爬虫从互联网上采集数据,经过加工分析,建立索引
  • 大小: 6.5 KB
  • 大小: 22.6 KB
分享到:
评论

相关推荐

    基于Lucene的全文检索系统

    总结来说,基于Lucene的全文检索系统利用了Java和Swing技术,结合Lucene的索引和搜索能力,为本地文件提供了便捷的全文搜索服务。用户只需输入关键词,系统就能快速找到相关的文档,极大地提高了工作效率。通过深入...

    lucene3.5全文检索案例lucene+demo

    在3.5版本中,Lucene提供了强大的文本处理、索引构建和搜索功能,使得开发者可以轻松地在自己的应用中实现高效的全文检索。本篇文章将围绕“lucene3.5全文检索案例lucene+demo”,详细讲解Lucene 3.5的核心概念、...

    lucene 全文检索

    Lucene 广泛应用于网站搜索、文档检索、信息提取等领域,是Java开发人员实现全文搜索引擎的首选工具。 在Lucene中,全文检索的核心概念包括以下几点: 1. **索引构建**:Lucene首先需要对数据进行索引,将非结构化...

    基于Java的全文索引检索引擎——Lucene

    【基于Java的全文索引检索引擎——Lucene】 Lucene是一个用Java编写的开源全文检索引擎库,由Doug Cutting创建并贡献给Apache基金会,成为Jakarta项目的一部分,后来成为Apache软件基金会下的顶级项目。它的主要...

    lucene全文检索资源包

    这个“lucene全文检索资源包”包含了 Lucene 的一个早期版本——1.4.3,虽然版本较老,但对于了解 Lucene 的基本原理和操作仍然具有一定的参考价值。 **一、全文检索概述** 全文检索是一种能够在大量文本数据中快速...

    开发自己的搜索引擎——Lucene+Heritrix

    Lucene是Java开发的全文检索库,而Heritrix则是一款功能丰富的网络爬虫,两者结合能帮助开发者构建完整的搜索引擎系统。 1. **Apache Lucene**: Lucene是Java平台上的一个全文检索库,提供了索引和搜索文本的高效...

    基于Lucene3.6进行全文检索的小案例

    1. **索引(Index)**:Lucene通过将文本数据转换为可搜索的结构——索引来实现全文检索。索引过程包括分词(Tokenization)、词干提取(Stemming)、停用词过滤(Stopword Removal)等步骤,以便优化搜索性能。 2....

    开发自己的搜索引擎——Lucene+Heritrix(第2版)_随书光盘.rar

    《开发自己的搜索引擎——Lucene+Heritrix(第2版)_随书光盘.rar》是一个包含资源的压缩包,主要用于帮助读者深入理解并实践搜索引擎的开发。Lucene和Heritrix是两个重要的开源工具,它们在构建搜索引擎的过程中起着...

    lucene in action_中文版(lucene实战)

    本书深入浅出地介绍了Lucene——一个开源的使用Java语言编写的全文搜索引擎开发包。它通过浅显的语言、大量的图注、丰富的代码示例,以及清晰的结构为读者呈现出作为优秀开源项目的Lucene 所体现的强大功能。全书共...

    Lucene全文检索

    总之,Lucene作为Java的全文检索引擎,通过其强大的分词和索引功能,为开发者提供了高效、灵活的文本搜索解决方案。通过理解并掌握Lucene的工作原理和使用方法,我们可以构建出满足业务需求的全文检索系统。

    Java搜索工具——Lucene实例总结(一)

    Java搜索工具——Lucene实例总结(一) 在Java开发中,搜索引擎已经成为不可或缺的一部分,而Apache Lucene正是一个强大的全文搜索引擎库。这篇博文将带你深入理解Lucene的基本概念和使用方式,帮助你快速入门并掌握...

    全文检索保存在文件中的数据——简单实例

    标题 "全文检索保存在文件中的数据——简单实例" 指向的是一个关于如何使用全文检索技术来查找存储在文件系统中的数据的实践教程。在这个主题中,我们主要会探讨两个核心概念:全文检索和Lucene。 全文检索是一种在...

    基于Lucene的桌面搜索引擎.doc

    【描述】:该文档主要探讨了如何利用Apache Lucene构建一个桌面搜索引擎,这是一个开源的全文检索库,为开发者提供了强大的文本搜索功能。 【标签】:“Lucene 搜索引擎” 【部分内容】:在深入理解基于Lucene的...

    最新全文检索系统开源lucene资料大全(pdf格式)

    在本资料包中,重点是开源的全文检索库——Lucene。 **Lucene简介** Lucene是由Apache软件基金会开发的一个高性能、全文本搜索库,它提供了基础的索引和搜索功能,同时也支持高级搜索特性,如布尔运算、短语搜索、...

    JSP源码——[搜索链接]java(结合lucene)版的公交搜索系统_javaso.zip

    总而言之,这个公交搜索系统结合了JSP的动态网页处理能力与Lucene的全文检索优势,为用户提供了一种高效、便捷的公交线路查询服务。系统的设计与实现不仅涵盖了Java Web开发的基础知识,还涉及到了数据库操作、搜索...

    开放源代码的全文检索引擎Lucene[归纳].pdf

    它的设计目标是为开发人员提供一个易于使用的工具,以便在自己的应用程序中集成全文检索功能,或者构建基于 Lucene 的完整搜索引擎。 【全文检索系统基础】 全文检索系统是基于全文检索理论建立的软件系统,其基本...

    Lucene初试——关于大文本建立索引和中文乱码以及QueryParser检索的一些体会 - sheen口开河 - CSDN博客

    【Lucene大文本建索引】 ...通过合理的配置和优化,可以有效地利用Lucene构建高性能的全文搜索引擎。在实际应用中,还需要关注性能优化,如索引的更新策略、查询性能的提升等,以满足不同场景的需求。

    [开发自己的搜索引擎——Lucene.Heritrix(第2版)[CD资源包]].Lucene.rar

    《开发自己的搜索引擎——Lucene.Heritrix(第2版)[CD资源包].Lucene.rar》这个压缩包文件,显然包含的是与构建自定义搜索引擎相关的资源,主要聚焦于两个核心工具:Lucene和Heritrix。这两者在信息技术领域,特别是...

    全文检索技术 lucene(二) 自己动手写一个搜索引擎

    在本篇文章中,我们将深入探讨全文检索技术,特别是聚焦于Apache Lucene库,这是一个强大的开源全文搜索引擎库。我们将逐步解析如何使用Lucene自己动手构建一个简单的搜索引擎,这将涵盖从理解基本概念到实现具体...

Global site tag (gtag.js) - Google Analytics