`

lucene学习笔记3

阅读更多
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索和
操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接
数据库一样简单。

值得一提的是:2006年6月1号Lucene2.0发布,它与以前广泛应用和介绍的Lucene 1.4.3并不兼容。有了很大的改进和优化,这里只介绍的是
Lucene 2.0。

Lucene2.0的下载地址是http://apache.justdn.org/lucene/java/

大家先看一个例子,通过这个例子来对lucene的一个大概的认识。

一个Junit测试用例:(为了让代码清晰好看,我们将异常都抛出)

a)    这是一个建立文件索引的例子

public void testIndexHello() throws IOException {

        Date date1 = new Date();


        //可以说是创建一个新的写入工具


        //第一个参数是要索引建立在哪个目录里


        //第二个参数是新建一个文本分析器,这里用的是标准的大家也可以自己写一个


        //第三个参数如果是true,在建立索引之前先将c:\\\\index目录清空。

        IndexWriter writer = new IndexWriter("c:\\\\index",new StandardAnalyzer(),true);


//这个是数据源的文件夹


        File file = new File("c:\\\\file");

        /**
         * 例子主要是将C:\\\\file目录下的文件的内容进行建立索引,将文件路径作为搜索内容的附属< span lang="EN-US">.
         */

        if(file.isDirectory())
        {
            String[] fileList = file.list();

            for (int i = 0; i < fileList.length; i++) {

// 建立一个新的文档,它可以看作是数据库的一行记录

                Document doc = new Document();

                File f = new File(file, fileList[i]);

Reader reader = new BufferedReader(new FileReader(f));

doc.add(new Field("file",reader));//为doument添加field

doc.add(new Field("path",f.getAbsolutePath(),Field.Store.YES,Field.Index.NO));

                writer.addDocument(doc);
            }
        }
        writer.close();//这一步是必须的,只有这样数据才会被写入索引的目录里

        Date date2 = new Date();

        System.out.println("用时"+(date2.getTime()-date1.getTime())+"毫秒");

}

注意:因为建立索引本来就是费时,所以说最后输出的用时会比较长,请不要奇怪。

b)一个通过索引来全文检索的例子

public void HelloSearch() throws IOException, ParseException {

        IndexSearcher indexSearcher = new IndexSearcher("c:\\\\index");//和上面的IndexWriter一样是一个工具

        QueryParser queryParser = new QueryParser("file",new StandardAnalyzer()); //StandardAnalyzer这是一个分词器

        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
//这个地方Query是抽象类大家也注意一下,下面会讲到的< span style="font-size: 10pt; font-family: 宋体;" lang="EN-US">
// 宋体;" lang="EN-US">
Query query = queryParser.parse(br.readLine());

Hits hits = indexSearcher.search(query);

Document doc = null;

        System.out.print("正搜索................");

        for (int i = 0; i < hits.length(); i++){

doc = hits.doc(i);

System.out.println("内容是:"+doc.get("file"));//注意这里输出的是什么

System.out.println("文件的路径是:" + doc.get("path"));

}

    }

通过上面的两个例子应该可以看出Lucene还是比较简单的。

运行一下上面的两个例子,大家可能会说怎么doc.get(“file”);返回的是空呢,我们马上会讲到。
分享到:
评论

相关推荐

    【大搜集:lucene学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>

    lucene学习笔记 3 .txt lucene入门实战.txt Lucene 的学习 .txt Lucene-2.0学习文档 .txt Lucene入门与使用 .txt lucene性能.txt 大富翁全文索引和查询的例子程序.txt 关于lucene2.0的创建、检索和删除功能...

    lucene学习资料

    10. **lucene学习笔记 3 .txt** 这是作者的学习笔记,可能包含了个人理解和使用Lucene过程中遇到的问题及解决方案,提供了不同角度的见解和实践经验。 通过这些文档,你可以系统地学习和掌握Lucene的各个方面,从...

    Lucene 学习笔记 1

    **Lucene 学习笔记 1** Lucene 是一个全文搜索引擎库,由 Apache 软件基金会开发。它提供了一个可扩展的、高性能的搜索框架,使得开发者能够在其应用程序中集成高级的搜索功能。本篇学习笔记将深入探讨 Lucene 的...

    lucene学习笔记

    标题:Lucene学习笔记 描述:Lucene学习笔记,Lucene入门必备材料 知识点: 一、Lucene概述与文档管理策略 Lucene是一款高性能、全功能的文本搜索引擎库,广泛应用于文档检索、全文搜索等场景。为了提升搜索效率...

    Lucene 3.6 学习笔记

    【Lucene 3.6 学习笔记】 Lucene 是一个高性能、全文本搜索库,广泛应用于各种搜索引擎的开发。本文将深入探讨Lucene 3.6版本中的关键概念、功能以及实现方法。 ### 第一章 Lucene 基础 #### 1.1 索引部分的核心...

    Lucene学习笔记(一)Lucene入门实例

    NULL 博文链接:https://kylinsoong.iteye.com/blog/719415

    Lucene学习笔记

    【Lucene学习笔记】 Lucene 是一款开源的全文检索框架,由Apache软件基金会维护,它提供了高效的、可扩展的搜索引擎功能。不同于一个完整的应用程序,Lucene 提供的是一个基础组件,开发者可以将其集成到自己的应用...

    lucene3.5学习笔记

    ### Lucene 3.5 学习笔记 #### 一、Lucene 3.5 基本概念 ##### 1.1 Lucene 概述 **1.1.1 IndexWriter** `IndexWriter` 是 Lucene 中的核心类之一,用于创建或更新索引。它提供了添加文档、删除文档、优化索引等...

    lucene 3.5学习笔记

    《Lucene 3.5 学习笔记》 在信息技术高速发展的今天,搜索引擎技术成为了信息检索的核心工具。Apache Lucene,作为一个开源全文检索库,为开发者提供了强大的文本搜索功能。本文将深入探讨Lucene 3.5版本的相关知识...

    lucene3.0学习笔记(三)与paoding整合

    《Lucene 3.0 学习笔记(三)与Paoding整合》 在深入了解Lucene 3.0的过程中,我们经常会遇到如何将其与第三方工具进行整合的问题,以提升搜索性能和用户体验。这篇学习笔记主要关注的是将Lucene 3.0与Paoding搜索...

    lucene基础学习笔记&源码

    **Lucene 基础学习笔记与源码分析** **一、Lucene 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发并维护。它是一个 Java 开发的开源项目,被广泛应用于各种搜索引擎的构建,支持多种编程...

    本人的Lucene2.9学习笔记

    《深入理解Lucene 2.9.1:构建与搜索的全方位解析》 Lucene,作为一款开源的全文搜索引擎库,被广泛应用于各种信息检索场景。本文将详细讲解Lucene 2.9.1版本的核心概念、架构以及索引创建与搜索的流程。 一、...

Global site tag (gtag.js) - Google Analytics