`
longgangbai
  • 浏览: 7339910 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

luence学习的指南文档

阅读更多

2.代码使用场合:在搜索引擎检索索引目录的中的信息

/**

  * 检索索引文件内容中是否包含查询的字词信息

  * @param indexDir  索引的目录

  * @param search  查询字词信息

  * @throws Exception

  */

  @SuppressWarnings("deprecation")

public static void search(File indexDir,String search) throws Exception

  {

      //创建索引存储的位置的

      Directory fsDir=FSDirectory.getDirectory(indexDir,true);

      //创建用于搜索IndexWriter类所创建的索引

      IndexSearcher is=new IndexSearcher(fsDir);

      //创建标准分析器对象的

      Analyzer analyzer= new StandardAnalyzer();

      //创建一个查询解析器的应用开发

      QueryParser queryparser=new QueryParser(search,analyzer);

      //创建一个查询对象的

      Query query=queryparser.parse(search);

      //创建一个查询单元的信息

      //Term term=new Term("contents",search);

      // Query query=new TermQuery(term);

     

      long start=new Date().getTime();

     // 存放有序索引结果的指针的简单容器,代表匹配已知查询的一系列文档的检索结果

      Hits hits=is.search(query);

      long end=new Date().getTime();

      System.out.println((end-start));

      for (int i = 0; i < hits.length(); i++) {

       //检索匹配的文档对象

       Document doc=hits.doc(i);

       System.out.println("content:"+doc.get("contents"));

       System.out.println(" "+doc.get("filename"));

    }

  }

}

3.          使用场合:查询一个词语的一系列同义词的,一种一般做法从数据库中查询给定词语的所有同义词

方法一:并将它添加到一个字符串中去,然后可以通过这个字符串创建一个Luence域对象。

方法二:它仅仅同时给一个相同的域赋予多个不同的值。Luence将自动将相同键的域的值合并成一个单词对它们进行检索。

/**

 * 可追加的域对象的应用

 * @param args

 * @throws IOException

 */

public  void thesaurus(IndexWriter writer) throws IOException {

    String baseword="quick";

    String[] synonyms={"quick","rapid","speedy"};

    Document doc=new Document();

    doc.add(Field.Text("word",baseword));

    for (String value : synonyms) {

       doc.add(Field.Keyword("word",value));

    }

    writer.addDocument(doc);

}

分享到:
评论

相关推荐

    luence客户端测试软件luke

    "luence客户端测试软件luke" 指的是一个名为"Luke"的工具,它是针对Apache Lucene(一个流行的全文搜索引擎库)的客户端测试和分析工具。Luence可能是“Lucene”的拼写错误,但在这里我们假设指的是Lucene。 **描述...

    Lucene 2.9 API CHM 官方API学习资料电子书

    lucene 2.9 API , lucene API,lucene 学习资料,lucene2.9 CHM

    lucene学习lucene学习

    1. 准备待索引的文档:确保你的文档是可以被 Lucene 处理的文本格式,例如 .txt 文件。如果文档是非文本格式,如 HTML 或 PDF,你需要先将其转换为纯文本。 2. 创建索引:清单 1 展示了一个简单的 Java 示例,演示...

    Luence.net搜索小程序

    通过"Luence.net搜索小程序",我们可以学习到如何实现实时搜索、高亮显示、盘古分词以及智能匹配等一系列高级搜索功能。 首先,Luence.net是Apache Lucene项目的一个.NET版本,Lucene作为业界知名的全文搜索引擎库...

    Luence和ElasticSearch面试准备.docx

    《Luence和ElasticSearch面试准备》 Lucene和ElasticSearch是两个在全文搜索引擎领域中广泛使用的开源工具。Lucene是一个高性能、全文本搜索库,而Elasticsearch则是在Lucene的基础上构建的一个分布式、RESTful风格...

    获取全部Luence数据

    ### 获取全部Luence数据 #### 知识点详解 **Lucene** 是一个高性能、全功能的文本搜索引擎库。在本文档中,我们将探讨如何通过Lucene获取索引中的所有文档,包括创建索引、查询索引以及遍历所有文档的具体步骤。 ...

    Luence搜索Demo

    总结来说,Luence.Net搜索Demo是一个极好的学习资源,它展示了如何利用Luence进行全文搜索,涵盖了从索引构建、查询解析到结果展示的全过程。通过深入研究和实践,开发者可以提升在.NET环境中构建高效搜索引擎的能力...

    Luence原理及源码分析

    lucene 原理与分析,底层源码解析,应用场景及实践,相关配置

    luence4.6例子

    5. **luence46**: 这个压缩包可能包含了Lucene 4.6版本的源代码,源码提供了深入了解其内部工作原理的机会。你可以通过阅读和分析源代码,学习如何实现自己的搜索功能,或者优化现有系统的搜索性能。 通过对...

    Luence简单实例

    **Lucene简介** Lucene是Apache软件基金会的一个开放源代码项目,它是一个高性能、全文本检索库,提供了Java实现的...这种实例有助于开发者快速理解和掌握Lucene的基本用法,为进一步深入学习和应用Lucene打下基础。

    IKAnalyzer和luence压缩包大全

    **"IKAnalyzer中文分词器V2012_FF使用手册.pdf"** 提供了详细的使用指南,对于初学者来说是非常宝贵的资源。它会解释如何安装IKAnalyzer,如何配置和使用,以及如何解决可能出现的问题。通过阅读这份手册,开发者...

    luence搜索

    1. 文档(Document):在Lucene中,文档是信息的基本单位,它可以包含多个字段(Field),每个字段都有自己的名称和内容,比如标题、内容等。 2. 字段(Field):字段是文档的组成部分,用于存储不同类型的数据,如...

    luence索引例子

    描述中提到“使用luence索引数据库中的记录”,意味着我们将学习如何将数据库中的数据转化为Lucene可处理的格式,并创建索引。这个过程通常包括以下步骤: 1. **初始化Lucene**: 创建一个`Directory`对象,这是...

    lucene基础学习笔记&源码

    **Lucene 基础学习笔记与源码分析** **一、Lucene 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发并维护。它是一个 Java 开发的开源项目,被广泛应用于各种搜索引擎的构建,支持多种编程...

    Luence in Action 中英文pdf 版

    《Lucene in Action》是一本深入探讨Apache Lucene的权威指南,这本书的中英文PDF版本提供了全面了解和学习这个搜索引擎库的机会。Lucene是Java开发的一款高性能、全文本搜索库,广泛应用于各种需要强大搜索功能的...

    lucene-core-7.3.1-API文档-中文版.zip

    包含翻译后的API文档:lucene-core-7.3.1-javadoc-API文档-中文(简体)版.zip; Maven坐标:org.apache.lucene:lucene-core:7.3.1; 标签:apache、lucene、core、中文文档、jar包、java; 使用方法:解压翻译后的API...

    lucene-5.5.3对应的源码文件

    3. 文档分析器(Analyzer):结合分词器和过滤器,根据特定语言规则对文档进行分析。 4. 倒排索引(Inverted Index):Lucene的核心数据结构,将每个单词映射到包含该单词的文档列表,便于快速查找。 二、Lucene的...

    lucene-搜索过程源码解析-Score树

    该步骤中,`IndexSearcher`遍历子读取器(`subReaders`),为每个读取器设置下一个文档的起始位置,并根据`collector`是否接受文档顺序错乱来调用权重对象的`scorer`方法,获取评分器(`Scorer`)。评分器用于实际计算每...

    Lucene5学习之FunctionQuery功能查询

    **标题解析:** "Lucene5学习之FunctionQuery功能查询" Lucene5是Apache Lucene的一个版本,这是一个高性能、全文本搜索库,广泛应用于搜索引擎和其他需要高效文本检索的系统。FunctionQuery是Lucene中的一种查询...

    Luence的与盘古分词的使用软件

    总之,“Luence的与盘古分词的使用软件”是将Lucene.NET和盘古分词相结合,利用C# .NET技术在VS2013环境下构建的一款文本处理应用。它实现了对用户输入句子的分词,以及基于分词结果的索引查询,从而在大量文本数据...

Global site tag (gtag.js) - Google Analytics