2.代码使用场合:在搜索引擎检索索引目录的中的信息
/**
* 检索索引文件内容中是否包含查询的字词信息
* @param indexDir 索引的目录
* @param search 查询字词信息
* @throws Exception
*/
@SuppressWarnings("deprecation")
public static void search(File indexDir,String search) throws Exception
{
//创建索引存储的位置的
Directory fsDir=FSDirectory.getDirectory(indexDir,true);
//创建用于搜索IndexWriter类所创建的索引
IndexSearcher is=new IndexSearcher(fsDir);
//创建标准分析器对象的
Analyzer analyzer= new StandardAnalyzer();
//创建一个查询解析器的应用开发
QueryParser queryparser=new QueryParser(search,analyzer);
//创建一个查询对象的
Query query=queryparser.parse(search);
//创建一个查询单元的信息
//Term term=new Term("contents",search);
// Query query=new TermQuery(term);
long start=new Date().getTime();
// 存放有序索引结果的指针的简单容器,代表匹配已知查询的一系列文档的检索结果
Hits hits=is.search(query);
long end=new Date().getTime();
System.out.println((end-start));
for (int i = 0; i < hits.length(); i++) {
//检索匹配的文档对象
Document doc=hits.doc(i);
System.out.println("content:"+doc.get("contents"));
System.out.println(" "+doc.get("filename"));
}
}
}
3. 使用场合:查询一个词语的一系列同义词的,一种一般做法从数据库中查询给定词语的所有同义词
方法一:并将它添加到一个字符串中去,然后可以通过这个字符串创建一个Luence域对象。
方法二:它仅仅同时给一个相同的域赋予多个不同的值。Luence将自动将相同键的域的值合并成一个单词对它们进行检索。
/**
* 可追加的域对象的应用
* @param args
* @throws IOException
*/
public void thesaurus(IndexWriter writer) throws IOException {
String baseword="quick";
String[] synonyms={"quick","rapid","speedy"};
Document doc=new Document();
doc.add(Field.Text("word",baseword));
for (String value : synonyms) {
doc.add(Field.Keyword("word",value));
}
writer.addDocument(doc);
}
分享到:
相关推荐
"luence客户端测试软件luke" 指的是一个名为"Luke"的工具,它是针对Apache Lucene(一个流行的全文搜索引擎库)的客户端测试和分析工具。Luence可能是“Lucene”的拼写错误,但在这里我们假设指的是Lucene。 **描述...
lucene 2.9 API , lucene API,lucene 学习资料,lucene2.9 CHM
1. 准备待索引的文档:确保你的文档是可以被 Lucene 处理的文本格式,例如 .txt 文件。如果文档是非文本格式,如 HTML 或 PDF,你需要先将其转换为纯文本。 2. 创建索引:清单 1 展示了一个简单的 Java 示例,演示...
通过"Luence.net搜索小程序",我们可以学习到如何实现实时搜索、高亮显示、盘古分词以及智能匹配等一系列高级搜索功能。 首先,Luence.net是Apache Lucene项目的一个.NET版本,Lucene作为业界知名的全文搜索引擎库...
《Luence和ElasticSearch面试准备》 Lucene和ElasticSearch是两个在全文搜索引擎领域中广泛使用的开源工具。Lucene是一个高性能、全文本搜索库,而Elasticsearch则是在Lucene的基础上构建的一个分布式、RESTful风格...
### 获取全部Luence数据 #### 知识点详解 **Lucene** 是一个高性能、全功能的文本搜索引擎库。在本文档中,我们将探讨如何通过Lucene获取索引中的所有文档,包括创建索引、查询索引以及遍历所有文档的具体步骤。 ...
总结来说,Luence.Net搜索Demo是一个极好的学习资源,它展示了如何利用Luence进行全文搜索,涵盖了从索引构建、查询解析到结果展示的全过程。通过深入研究和实践,开发者可以提升在.NET环境中构建高效搜索引擎的能力...
lucene 原理与分析,底层源码解析,应用场景及实践,相关配置
5. **luence46**: 这个压缩包可能包含了Lucene 4.6版本的源代码,源码提供了深入了解其内部工作原理的机会。你可以通过阅读和分析源代码,学习如何实现自己的搜索功能,或者优化现有系统的搜索性能。 通过对...
**Lucene简介** Lucene是Apache软件基金会的一个开放源代码项目,它是一个高性能、全文本检索库,提供了Java实现的...这种实例有助于开发者快速理解和掌握Lucene的基本用法,为进一步深入学习和应用Lucene打下基础。
**"IKAnalyzer中文分词器V2012_FF使用手册.pdf"** 提供了详细的使用指南,对于初学者来说是非常宝贵的资源。它会解释如何安装IKAnalyzer,如何配置和使用,以及如何解决可能出现的问题。通过阅读这份手册,开发者...
1. 文档(Document):在Lucene中,文档是信息的基本单位,它可以包含多个字段(Field),每个字段都有自己的名称和内容,比如标题、内容等。 2. 字段(Field):字段是文档的组成部分,用于存储不同类型的数据,如...
描述中提到“使用luence索引数据库中的记录”,意味着我们将学习如何将数据库中的数据转化为Lucene可处理的格式,并创建索引。这个过程通常包括以下步骤: 1. **初始化Lucene**: 创建一个`Directory`对象,这是...
**Lucene 基础学习笔记与源码分析** **一、Lucene 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发并维护。它是一个 Java 开发的开源项目,被广泛应用于各种搜索引擎的构建,支持多种编程...
《Lucene in Action》是一本深入探讨Apache Lucene的权威指南,这本书的中英文PDF版本提供了全面了解和学习这个搜索引擎库的机会。Lucene是Java开发的一款高性能、全文本搜索库,广泛应用于各种需要强大搜索功能的...
包含翻译后的API文档:lucene-core-7.3.1-javadoc-API文档-中文(简体)版.zip; Maven坐标:org.apache.lucene:lucene-core:7.3.1; 标签:apache、lucene、core、中文文档、jar包、java; 使用方法:解压翻译后的API...
3. 文档分析器(Analyzer):结合分词器和过滤器,根据特定语言规则对文档进行分析。 4. 倒排索引(Inverted Index):Lucene的核心数据结构,将每个单词映射到包含该单词的文档列表,便于快速查找。 二、Lucene的...
该步骤中,`IndexSearcher`遍历子读取器(`subReaders`),为每个读取器设置下一个文档的起始位置,并根据`collector`是否接受文档顺序错乱来调用权重对象的`scorer`方法,获取评分器(`Scorer`)。评分器用于实际计算每...
**标题解析:** "Lucene5学习之FunctionQuery功能查询" Lucene5是Apache Lucene的一个版本,这是一个高性能、全文本搜索库,广泛应用于搜索引擎和其他需要高效文本检索的系统。FunctionQuery是Lucene中的一种查询...
总之,“Luence的与盘古分词的使用软件”是将Lucene.NET和盘古分词相结合,利用C# .NET技术在VS2013环境下构建的一款文本处理应用。它实现了对用户输入句子的分词,以及基于分词结果的索引查询,从而在大量文本数据...