`

[Lucene] Lucene入门心得

阅读更多

主要参考文章: http://www.cnblogs.com/dyllove98/archive/2013/06/19/3144919.html

但是我利用了搜狗的语料库来进行测试:http://www.sogou.com/labs/dl/c.html

此次使用的是其mini版 demo而已嘛:)

 

主要代码可以参考来源的博客,基本上copy到eclipse之中就能用。本人小小改动了一下而已。

唯一想说的就是,本人打开lucene的压缩包之后,发现了数不清的jar 包,顿时就无语不知所措了~

实际上,对于一个普通的创建索引+搜索的任务,会需要下面几个包就可以了:

(1) core / lucene-core-4.6.1.jar

这个是核心类库,少不了的

 

(2) analysis \ common \ lucene-analyzers-common-4.6.1.jar

普通分词的类库。 其他的比如icu之中的jar包,是不同算法实现的。暂时没有深究

 

(3) queryparser \ lucene-queryparser-4.6.1.jar

这个是查询的时候需要的,如果仅仅是做分词、创建索引 无需这个jar包

 

运行LuceneSearch.java 

其中我搜索的关键词是: 集团

结果:

正在检索关键字 : 集团
检索完成,用时17毫秒
这是第0个检索到的结果,文件名为:e:\lucene\file\10.txt
这是第1个检索到的结果,文件名为:e:\lucene\file\16.txt
--------------------------

 

作为对比,使用Apache Commons IO的FileUtils进行纯文件读并查询,结果如下:

e:\lucene\file\10.txt
e:\lucene\file\16.txt
耗时:26毫秒

 因此可以看到,创建了索引的搜索速度还是要提高不少的。

PS: 这个搜索结果的时间,第一次可能会比较长,达到60+毫秒,那可能是因为需要把.java变成.class

最后贴一下我的项目截图:



 

  • 大小: 16.1 KB
2
0
分享到:
评论

相关推荐

    lucene.net 完全入门教程

    lucene.net 完全入门教程,包括 lucene.net 介绍, lucene.net工作模式, lucene.net分词方法和中文分词方法, lucene.net索引的建立详解, lucene.net搜索详解, lucene.net的下载方法, lucene.net搜索结果实现...

    Lucene3.4开发入门.pdf

    Lucene3.4开发入门.pdf

    lucene3.6的入门案例

    **Lucene 3.6 入门案例** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了完整的搜索功能,包括索引、查询、评分等,广泛应用于各种项目和产品中。在这个入门案例中,我们将深入理解如何...

    lucene.net+完全入门教程

    通过学习这个“lucene.net+完全入门教程”,开发者可以了解如何在.NET环境中设置Lucene.Net项目,创建和管理索引,编写查询,优化搜索性能,并掌握如何处理搜索结果。教程可能涵盖从安装步骤、基本概念介绍,到实战...

    Lucene入门与使用

    Lucene入门与使用,非常简单,适合入门

    最新全文检索 lucene-5.2.1 入门经典实例

    《最新全文检索 Lucene-5.2.1 入门经典实例》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,广泛应用于各种信息检索系统。在5.2.1版本中,Lucene提供了更为高效和强大的搜索功能,为开发者提供了构建...

    Lucene 3.0完成入门

    《Lucene 3.0 完成入门》 Lucene 是一个开源的全文检索库,由 Apache 软件基金会维护。它为开发者提供了一种高级的文本搜索功能,允许他们在应用程序中集成强大的搜索引擎。本篇文章将围绕 Lucene 3.0 版本,详细...

    全文检索 lucene-5.2.1 入门Eclipse工程实例

    Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对

    lucene 入门

    `lucene入门小实例.txt` 文件中可能包含了一个简单的Lucene使用示例,例如: 1. 创建 `Directory` 对象,比如使用 `FSDirectory.open()` 打开一个文件系统的目录来存储索引。 2. 实例化 `Analyzer`,如使用 `...

    Lucene-入门

    **标题:“Lucene-入门”** Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发并维护。它是Java编写的一个开源项目,被广泛应用于构建搜索引擎或者在大型数据集上进行全文检索。Lucene提供了丰富的搜索...

    Lucene 简单入门程序实例

    标题与描述:“Lucene简单入门程序实例”这一标题与描述明确指出文章将引导读者通过一个实际的示例来了解和掌握Lucene的基本操作。Lucene是一个高性能、全功能的文本搜索引擎库,它允许用户对文档进行索引和搜索。本...

    Lucene使用lucene入门[归类].pdf

    【Lucene 概述】 Lucene 是一个开源的全文搜索引擎框架,主要负责处理文本数据的检索和搜索。作为一款开发工具,它不直接提供类似百度或Google Desktop的现成产品,而是为开发者提供了构建自定义搜索应用的基础。...

    lucene入门小例子

    这个“lucene入门小例子”很可能是为了帮助初学者理解并掌握Lucene的基本用法而设计的一系列示例代码。 Lucene的核心概念包括索引、文档、字段和查询。首先,你需要理解索引的概念,它类似于传统数据库中的索引,但...

    读书笔记:Lucene全文检索入门项目 Java实现Maven项目 Elasticsearch 基础实战.zip

    读书笔记:Lucene全文检索入门项目 Java实现Maven项目 Elasticsearch 基础实战

    Lucene全文检索入门项目 Java实现Maven项目 Elasticsearch 基础实战.zip

    【标题】"Lucene全文检索入门项目 Java实现Maven项目 Elasticsearch 基础实战" 提供了一个学习如何在Java环境中运用全文检索技术的起点。这个项目涵盖了两个主要的开源工具:Lucene和Elasticsearch,它们都是业界...

    Lucene2.4入门总结

    **Lucene 2.4 入门指南** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了高级文本检索功能,广泛用于构建搜索引擎和其他需要高效全文检索能力的应用。本文将重点介绍 Lucene 2.4 版本的...

    Lucene 的入门 实例 代码

    【Lucene 入门教程】 Lucene 是一个由Apache软件基金会开发的开源全文检索引擎工具包,它并非一个完整的搜索引擎,而是提供了一个强大的架构,允许开发人员轻松地在他们的应用程序中集成全文检索功能。Lucene 支持...

    lucene 3.0 入门实例

    doc.add(new Field("title", "Lucene入门", Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("content", "这是Lucene 3.0的实例", Field.Store.YES, Field.Index.ANALYZED)); ``` 3. **查询...

Global site tag (gtag.js) - Google Analytics