我想用lucene实现搜索功能,我有6个txt文档,加起来有2G左右,存放在一个文件夹内,我想对里面的数据实现搜索,同时最后返回含有这个数据的文档名称以及该文档中包含这个数据的那一行文本,我用的是lucene3.0。但是我现在遇到了一个问题。建立索引时代码片段如下:
doc.add(new Field("contents", temp, Field.Store.YES, Field.Index.ANALYZED ));
doc.add(new Field("filename", files[i].getName(), Field.Store.YES, Field.Index.NOT_ANALYZED));
即对文档内容和文档名称建立索引,同时存储属性都设置为存储,可是我的文档内容2G左右,要解析成string类型的temp进行存储,java的内存不够,每次都提示内存溢出。可是如果不存储的话最后不能实现“该文档中包含这个数据的那一行文本”这个功能,我想请问一下,我如果想实现返回我搜索的那个数据所在行的文档内容的话,lucene能实现吗?具体该用lucene的哪个模块实现?
期待大家的帮忙。
相关推荐
在这个"一个关于lucene实例"的压缩包中,很可能是为了帮助初学者理解并掌握Lucene的基本用法和核心概念。 Lucene的主要功能包括文档的索引和搜索。在索引过程中,它能够分析文本,将文本分词,然后将这些词语转换为...
Apache Lucene是一个高性能、全文本搜索库,它为开发者提供了构建全文搜索引擎所需要的基础工具。在这个项目例子中,我们将深入探讨如何利用Lucene进行索引构建、查询处理以及结果排序,从而创建一个功能完善的搜索...
全文搜索是指用户输入一个或多个关键词,系统返回包含这些关键词的文档。Lucene支持多种查询类型,如TermQuery、PhraseQuery、BooleanQuery等,可以组合使用以满足复杂查询需求。 **6. Lucene 插件和扩展** `05_...
- **定义**:Solr是一个独立的企业级搜索应用服务器,基于Lucene构建。它为用户提供了一个类似于Web服务的API接口,允许用户通过HTTP请求提交XML格式的数据以生成索引,或者执行查询并接收XML/JSON格式的结果。 - *...
3. **文档(Document)**: 在Lucene中,每个要搜索的信息被视为一个Document,包含多个Field,如标题、内容、作者等。 4. **字段(Field)**: Field是文档的组成部分,每个字段有特定的属性,如是否存储原始值、...
**正文** ...总结,利用Lucene搜索中文PDF文档涉及多个技术层面,包括中文分词、PDF解析、索引构建、搜索执行和性能优化。通过理解这些关键技术,开发者可以构建出高效、准确的中文PDF文档检索系统。
Lucene是Apache软件基金会下的一个开源全文检索库,提供了高性能的文本搜索能力。它不仅适用于网站的搜索功能,还可以用于任何需要文本搜索的应用场景,如邮件客户端、文档管理系统等。 #### 布尔操作符 Lucene支持...
在上面的代码中,`DateTools.DateToString`方法将DateTime对象转换为Lucene可理解的字符串格式,然后创建了一个包含这两个时间点的闭合范围查询。这里的“true”参数表示边界是包含的。 接下来,我们需要将这个...
**Lucene搜索引擎 JSP + ...综上所述,"Lucene搜索引擎 JSP + JAVA"项目展示了如何结合这三个强大的技术,构建一个高效、灵活的全文搜索引擎。通过深入理解和实践,开发者可以定制出满足特定需求的搜索引擎解决方案。
本文将深入探讨一个基于Apache Lucene的中型搜索引擎实现,该实现是由ShootSearch进行优化的。Lucene是一个开源的全文检索库,由Java编写,但可以通过各种语言接口,如C#,来使用。 **1. Lucene简介** Lucene是...
1. **文档(Document)**:在Lucene中,每个要搜索的文本对象被称为一个文档,文档由多个字段(Field)组成,如标题、内容、作者等。 2. **字段(Field)**:字段是文档的组成部分,每个字段都有一个名字和一个值,...
Lucene 是一个开源全文搜索引擎库,由 Apache 软件基金会开发。它提供了一个可扩展的、高性能的搜索框架,使得开发者能够轻易地在应用中集成全文检索功能。本实例将通过一个具体的应用场景,帮助大家了解 Lucene 的...
总结来说,Lucene搜索引擎的基本工作原理包括建立倒排索引、处理用户查询以及返回相关性最高的结果。同时,Lucene还支持与目录索引的集成,适应各种搜索场景。通过理解这些原理,开发者可以更好地利用Lucene构建高效...
Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发,被广泛应用于各种搜索引擎的构建。它提供了强大的索引和搜索功能,使得开发者能够轻松地在大量文本数据中实现高效的检索。在这个项目中,我们将深入探讨...
Lucene是一个由Java编写的高性能、可扩展的全文搜索引擎库。它提供了一种机制,使得开发者能够轻松地为自己的应用程序添加索引和搜索功能。作为Apache软件基金会的项目,Lucene具有开源和免费的特性,受到Apache软件...
Lucene作为一款强大的搜索引擎库,在实际应用中确实会遇到一些问题,如平台异常、查询异常、显示问题以及写锁异常等。针对这些问题,我们可以通过一系列措施来进行预防和解决,如正确使用查询语法、优化显示逻辑、...
在IT领域,搜索引擎技术是不可或缺的一部分,而Apache Lucene是一个高性能、全文本搜索库,它为开发者提供了构建自定义搜索引擎应用程序所需的所有工具。本篇我们将深入探讨如何在Lucene中实现模糊搜索,以及相关的...
而Lucene是Apache软件基金会的一个开放源代码全文搜索引擎库,能够帮助开发者实现强大的搜索功能。本篇文章将深入探讨如何在Spring MVC项目中集成Lucene进行全文搜索,以提升用户体验。 首先,我们需要理解Spring ...
Lucene是Apache软件基金会的一个开源全文检索库,提供高性能、可扩展的文本搜索功能。它包括索引和搜索的底层实现,如分词、文档存储、倒排索引等。开发者可以通过Lucene快速构建自己的搜索引擎。 **5. SSM与Lucene...