Lucene建立索引 - - ITeye博客

`

javafu

浏览: 57810 次
性别:
来自: 北京

最近访客更多访客>>

zyi74

w11h22j33

vliu

siemens800

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Lucene建立索引

博客分类：

Lucene

阅读更多

package com;

import java.io.File;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.wltea.analyzer.lucene.IKAnalyzer;

public class Index {

	
	public static void main(String[] args) {
		// Lucene Document的域名
		String fieldName = "discript";
		// 检索内容
		String text = "是一个好人民，住在地球村，拥有别墅，花园。";

		// 实例化IKAnalyzer分词器
		Analyzer analyzer = new IKAnalyzer();

		Directory directory = null;
		IndexWriter iwriter = null;
		File file = new File("C:/commFile/lucence");
		try {

			directory = FSDirectory.open(file);
			iwriter = new IndexWriter(directory,analyzer,true,IndexWriter.MaxFieldLength.LIMITED);
			//建立文档
			Document doc = new Document();
			doc.add(new Field(fieldName, text, Field.Store.YES,Field.Index.ANALYZED));
			doc.add(new Field("name", "anay", Field.Store.YES,Field.Index.ANALYZED));
			
			Document doc2 = new Document();
			doc2.add(new Field(fieldName, "中国人民", Field.Store.YES,Field.Index.ANALYZED));
			doc2.add(new Field("name", "国家", Field.Store.YES,Field.Index.ANALYZED));
			
			Document doc3 = new Document();
			doc3.add(new Field(fieldName, "要作主", Field.Store.YES,Field.Index.ANALYZED));
			doc3.add(new Field("name", "人民要作主", Field.Store.YES,Field.Index.ANALYZED));
				
			iwriter.addDocument(doc3);
			iwriter.addDocument(doc2);
			iwriter.addDocument(doc);
			// 索引优化
			iwriter.optimize();
			iwriter.close();
			
		}catch(Exception e ){
			e.printStackTrace();
		}
	}
}

分享到：

Lucene检索索引 | IO流读取文件

2013-10-28 21:49
浏览 478
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Lucene建立索引jar包和Paoding分词jar包: 在建立索引时，Lucene会对输入的文档进行分析，将其拆分成一个个的词汇，并为每个词汇创建一个倒排表，记录该词汇出现在哪些文档以及在文档中的位置信息。lucene-core-3.0.0.jar是Lucene的核心库，包含了构建和查询...

lucene全文检索简单索引和搜索实例: 《Lucene全文检索：简单索引与搜索实例详解》 Lucene是Apache软件基金会的开源项目，是一款强大的全文检索库，被广泛应用于Java开发中，为开发者提供了构建高性能搜索引擎的能力。在本文中，我们将深入探讨如何基于...

Lucene建立索引及查询包含“java”关键字示例代码: **Lucene创建索引与搜索"java"关键字的示例代码** Apache Lucene是一个高性能、全功能的文本搜索引擎库，广泛应用于各种系统中用于实现高效、精准的全文检索功能。这个示例代码将向我们展示如何使用Lucene来创建一...

lucene索引结构原理.docx: 全文检索的关键在于通过建立索引，将原本非结构化的文本数据转化为结构化的表示，使得搜索过程可以高效进行。在Lucene中，这个过程包括分析文本、创建倒排索引等步骤，使得搜索操作从线性时间复杂度转变为对数时间...

lucene索引非txt文档笔记: 在 Lucene 中建立索引时，需要将这些转换后的文本作为 String 类型输入到 Lucene 的 IndexWriter。以下是一个简单的示例，展示了如何使用 Lucene 建立索引： ```java Analyzer luceneAnalyzer = new ...

Lucene in Action 中文版: 　《Lucene实战第2版》基于Apache的Lucene 3 0 从Lucene核心 Lucene应用案例分析3个方面详细系统地介绍了Lucene 包括认识Lucene 建立索引为应用程序添加搜索功能高级搜索技术扩展搜索使用Tika提取文本 Lucene...

关于lucene建立数据库索引的更新说明: 2. **索引构建的灵活性**：建立索引的方法并非固定不变，可以根据自己的需求和理解来设计。Lucene的核心原理是将数据转换为可搜索的索引结构。尽管可以借鉴他人的实现，但最好理解其原理，以便根据实际情况调整。 3...

lucene 对 xml建立索引: ### Lucene对XML文档建立索引的技术解析与实践 #### 一、引言随着互联网技术的迅猛发展，非结构化数据（如XML文档）在企业和组织中的应用日益广泛。如何高效地处理这些非结构化的数据，特别是进行快速检索成为了一...

最简单的Lucene建立、搜索索引的方法: **建立索引的步骤** 1. **添加依赖**：在MyEclipse10中，首先需要导入Lucene相关的jar包，这些通常包括lucene-core、lucene-analyzers、lucene-queryparser等，确保所有必要的组件都已引入。 2. **创建索引目录**...

Lucene索引建立和搜索: 主要将如何使用Lucene建立索引以及搜索进行了代码的实现，有利于初学者熟悉Lucene的基本功能。

Lucene结合Sql建立索引Demo源码.rar: 本源码演示了Lucene结合Sql建立索引，把Sql中的数据通过建立索引用Lucene来检索【该源码由51aspx提供】源码 " onerror="this.src='/images/ifnoimg.gif'" src="/uploads/allimg/090904/1039152O5-0.jpg...

lucene4.6建立索引: ### Lucene4.6建立索引的关键步骤及实践 #### 一、基础知识介绍 Lucene是一个高性能、全功能的文本搜索引擎库。它提供了一种机制来存储和检索文本信息，并支持复杂的查询语法。Lucene的核心功能是建立索引和搜索...

基于lucene技术的增量索引: **基于Lucene技术的增量索引** 在信息技术领域，全文搜索引擎是处理大量数据查询的关键工具。Apache Lucene是一个开源的全文检索库，被广泛应用于构建高效、可扩展的搜索功能。本文将深入探讨如何利用Lucene实现...

毕设 Lucene解析索引PDF文档的内容: iTextPDFExtractor.java ------ ...--PDFBox创建PDF文件的Lucene索引 PDFBoxPathIndex.java ------- --PDFBox创建指定目录PDF文档索引 POIOfficeExtractor.java ----- -- POI处理Excel和Ｗord文档代码

lucene实现索引查询: 7. **写入Document并建立索引**：调用`IndexWriter.addDocument()`方法将Document写入索引。 8. **优化索引**：`IndexWriter.optimize()`可以合并索引段，提高查询性能。 9. **关闭索引写入器**：完成所有操作后，...

Lucene实现索引和查询的实例讲解: 数据库和Lucene建立索引都是为了查找方便，但是数据库仅仅针对部分字段进行建立，且需要把数据转化为格式化信息，并予以保存。而全文检索是将全部信息按照一定方式进行索引。 Lucene的架构设计主要包括两块：一是...

最新版windows lucene-8.5.2.zip: 例如，可以创建一个简单的文件搜索程序，将文件内容作为输入，利用Lucene建立索引，并实现快速搜索功能。 Lucene 8.5.2还引入了一些新特性，如支持更多语言的分词器，增强了对JSON和CSV等数据格式的处理能力，以及...

基于lucene的索引与搜索: 在Lucene中，索引过程包括分词、建立倒排索引以及存储相关元数据。倒排索引是Lucene的核心，它允许快速定位包含特定词汇的文档。搜索则通过查询解析、评分以及结果排序来实现，提供高效的检索性能。 2.2.3 Web...

lucene1.0.doc: 1. 三种方案：直接抓取网页内容后通过Lucene建立索引；中间层处理，抓取后存储到数据库，再由Lucene索引数据库；直接索引抓取的原始HTML。 2. 文件存储格式：通常采用倒排索引（Inverted Index）结构，便于快速查找...

Global site tag (gtag.js) - Google Analytics