`
archangel
  • 浏览: 12223 次
文章分类
社区版块
存档分类
最新评论

Re: 初次使用lucene2.0的心得和疑问

阅读更多
1. 没有太明白你的问题,但是感觉你好象理解不对。建立索引和搜索是两个分离的过程,只有在文章增删改的时候才会涉及到索引的操作。搜索操作基于索引操作生成的索引文件。 2. 这个不用担心,如果搜索结果很多,Lucene不是一次性把所有结果都加载到内存中的,而是只把前100条读入内存,当你请求后续数据的时候再继续加载。 3. IndexWriter的第三个参数仅仅表明是否创建索引文件,如果传入的目录中已经有索引文件存在,必须传入false否则会抛异常。 这个和索引条目的删除没有任何关系。索引条目删除必须手动调用IndexReader.deleteDocument()方法。
分享到:
评论

相关推荐

    lucene 2.0 api以及lucene 3.0 api

    **Lucene 2.0 API 和 Lucene 3.0 API 深度解析** Lucene 是一个由 Apache 软件基金会开发的全文搜索引擎库,它为开发者提供了在 Java 应用程序中实现高性能、可扩展的全文搜索功能的能力。Lucene 的 API 设计得相当...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    这里我们关注的是基于开源项目Lucene 2.0和Heritrix的一本书——《开发自己的搜索引擎》的源码资料。Lucene是一个高性能、全文本搜索库,而Heritrix则是一个强大的网页抓取工具,它们共同构成了搜索引擎的基础架构。...

    lucene2.0与其分词工具包

    使用Lucene 2.0,开发者需要了解如何创建索引、如何编写查询语句、如何执行搜索,以及如何对搜索结果进行处理。索引创建通常涉及读取源文件、分析内容、生成倒排索引等步骤。查询语句的构造则需要熟悉Lucene的...

    lucene2.0+Heritrix配套源码

    《lucene2.0+Heritrix配套源码》是一个针对搜索引擎开发的资源包,包含了构建自定义搜索引擎所需的关键组件。Lucene是一个流行的全文搜索引擎库,而Heritrix则是一个强大的网页抓取工具,用于收集互联网上的数据。这...

    开发自己的搜索引擎Lucene2.0+Heritrix

    通过使用 Lucene 和 Heritrix,我们可以构建一个具备高效搜索功能的自定义搜索引擎。Lucene 负责提供搜索和索引的核心技术,而 Heritrix 则负责数据抓取和预处理。两者相结合,不仅可以提高搜索效率,还能针对特定...

    lucene-2.0

    《深入理解Lucene 2.0:开源全文检索框架解析》 Lucene 2.0是一款强大的开源全文检索库,由Apache软件基金会开发并维护,是Java编程语言中的一个核心工具,广泛应用于搜索引擎的构建和其他信息检索场景。该版本发布...

    Lucene.2.0.API

    《Lucene.2.0.API》是关于开源全文搜索引擎库Lucene的一个重要参考资料,它详尽地记录了Lucene 2.0版本的API接口及其使用方法。Lucene是一个由Apache软件基金会开发的Java全文检索库,它提供了高性能、可扩展的文本...

    Lucene 2.0+Heriterx书源代码-ch7lib

    《深入理解Lucene 2.0与Heritrix:源码剖析》是一本关于搜索引擎开发的经典著作,书中详细讲解了如何使用Lucene 2.0和Heritrix这两个开源工具进行信息检索。在这个名为"Lucene 2.0+Heriterx书源代码-ch7lib"的压缩包...

    Lucene2.0+Heritrix(源代码)

    首先,我们要了解Lucene2.0和Heritrix的基本概念和功能。 Lucene2.0是Apache软件基金会的一个项目,它是一个高性能、全文检索库,提供了一个简单的API,允许开发者将全文搜索功能集成到他们的应用中。Lucene的核心...

    《开发自己的搜索引擎-Lucene 2.0 Heritrix》cd(全)(下载地址)

    根据提供的文件信息,我们可以深入探讨与“开发自己的搜索引擎-Lucene 2.0 Heritrix”相关的知识点,主要包括Lucene 2.0和Heritrix的基本概念、特点以及如何利用它们来构建一个简单的搜索引擎。 ### 一、Lucene 2.0...

    【完整光盘24.5M】开发自己的搜索引擎-Lucene 2.0+Heritrix.zip

    本资料集——"【完整光盘24.5M】开发自己的搜索引擎-Lucene 2.0+Heritrix.zip",正是这样一个学习资源,旨在帮助用户理解如何利用开源工具Lucene 2.0和Heritrix构建自己的搜索引擎。 Lucene是Apache软件基金会的一...

    lucene2.0+heritrix 随书光盘

    `lucenechapter2`可能包含的是关于Lucene 2.0的基础教程和实践案例,帮助学习者理解如何使用Lucene进行文档的索引、查询和排序等操作。 2. **Heritrix**: Heritrix是一个可配置、可扩展的互联网档案爬虫,用于...

    Lucene2.0+Heritrix搜索引擎 随书光盘

    《Lucene2.0+Heritrix搜索引擎》随书光盘包含了两个重要的开源搜索技术——Apache Lucene 2.0和Heritrix的资源和教程。Lucene是Java开发的全文检索库,而Heritrix则是一个网络爬虫工具,它们在构建大规模搜索引擎和...

    Lucene-2.0学习文档

    《深入理解Lucene-2.0:从源码到应用》 Lucene是一个开源的全文检索库,由Apache软件基金会开发并维护。它为Java开发者提供了强大的文本搜索功能,广泛应用于各种信息检索系统中。本篇文章将围绕"Lucene-2.0学习...

    Lucene2.0+Nutch0.8 API帮助文档(CHM格式)

    《Lucene2.0+Nutch0.8 API帮助文档》是一个综合性的技术资源,它包含了对Lucene 2.0和Nutch 0.8这两个关键的开源搜索引擎库的详细接口和功能说明。这两个组件在信息检索、全文搜索以及网络爬虫领域有着广泛的应用。 ...

    重要lucene2.0 学习文档

    总结一下,Lucene 2.0 提供了高效且易于使用的文本索引和搜索功能。通过 `IndexWriter` 可以构建索引,`Document` 和 `Field` 用于结构化数据的表示,而 `IndexSearcher` 和 `QueryParser` 则用于执行搜索操作。这些...

    Lucene.Net 2.0 源码+文档

    《深入理解Lucene.Net 2.0:源码与文档解析》 Lucene.Net是一个开源的全文搜索引擎库,它是Apache Lucene项目在.NET平台上的实现,由DotLucene发展而来,广泛应用于各种信息检索和文本挖掘场景。这个资料包包含了...

    Lucene2.0+Heritrix(ch4源代码)

    Lucene 2.0与Heritrix的结合使用,既能够充分利用Lucene强大的全文搜索能力,又能够利用Heritrix高效的网页抓取功能,构建出强大的信息检索系统。通过对源代码的学习和理解,开发者可以更深入地掌握这两者的内在工作...

    Lucene.net 2.0 API + DLL 下载

    另外,`Lucene.Net-2.0.doc.zip`文件可能包含的是关于Lucene.NET 2.0的文档资料,可能包括API参考、用户指南、示例代码等,对于学习和掌握这个版本的API非常有帮助。通过阅读这些文档,开发者可以理解如何初始化搜索...

    Lucene2.0实例

    在Lucene 2.0中,我们可以使用标准分析器(StandardAnalyzer)或其他自定义分析器来处理不同的语言和文本格式。 3. **添加文档**:每个要被搜索的数据对象都对应一个Lucene的`Document`对象。我们可以向`Document`...

Global site tag (gtag.js) - Google Analytics