`

lucence hello world

    博客分类:
  • java
阅读更多
/*
	 * lucence version 3.0.3
	 * 全文检索
	 * 
	 * 倒排索引:单词指向文档。以关键词和分词为单位,先读取文档内容,拆分关键词,关键词定位。
	 * 因为词语的数量是有限的,所以索引量不会随着文本内容的增长也线性增长。
	 * 
	 * 引入lucence jar包
	 */
	public static void main(String[] args) throws Exception {
		//A创建索引
		//简单例子,创建索引保存在内存中
		Directory dir = new RAMDirectory();
		//分词器使用lucence标准的,参数Version指定使用的lucence版本
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		/*
		 * IndexWriter 创建和维护索引
		 * param1 
		 * param2 指定创建索引使用的分词器
		 * param3 是否覆盖已有索引
		 * param4 最大Field长度
		 * 
		 */
		IndexWriter writer = new IndexWriter(
				dir,analyzer,true,IndexWriter.MaxFieldLength.UNLIMITED);
		//添加索引
		String[] docs ={
				"hello java",
				"search aha java",
				"friday hello"
		};
		/*
		 * Document是Field的容器,被搜索的单元,搜索结果是已doc的形式返回
		 * 每个Field拥有Key,Value
		 */
		for(int i = 0;i<docs.length;i++){
			Document d = new Document();
			d.add(new Field("name" //key
							,docs[i]//value
							,Store.YES//是否存储在索引中
							,Index.ANALYZED//该Field是否被索引
			));
			writer.addDocument(d);//将doc交给writer处理
		}
		writer.close();
		
		
		//B 搜索
		//创建搜索对象
		//参数是索引目录,指定为上面创建的索引
		Searcher searcher = new IndexSearcher(dir);
		QueryParser parser = new QueryParser(
							Version.LUCENE_30 //指定版本
							,"name" //默认搜索的Feild(key)
							,analyzer//搜索用的分词器,和上面创建索引使用一样的
							);
		Query query = parser.parse("hello"/*需要解析搜索的关键词*/);
		//搜索,取结果的前5条
		ScoreDoc[] tds = searcher.search(query,5).scoreDocs;
		System.out.println(tds.length);//符合结果doc数
		for(int i=0;i<tds.length;i++){
			Document doc = searcher.doc(tds[i].doc);
			//打印doc中key是name的Field的value
			System.out.println(doc.get("name"));
		}
		/*输出结果
		 * 	2
			hello java
			friday hello
		 */
	}
1
4
分享到:
评论

相关推荐

    Lucene之Helloworld

    《Lucene之HelloWorld》 在信息技术领域,搜索引擎是一个不可或缺的部分,而Apache Lucene作为一款高性能、全文本搜索库,为开发者提供了强大的文本检索能力。本文将深入探讨如何使用Lucene进行基本操作,通过...

    lunece入门之HelloWorld

    《Lucene入门之HelloWorld》 Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发并维护。它提供了一个简单但功能强大的API,用于在各种应用中实现文本的索引和搜索。这篇博文将带你走进Lucene的世界,通过...

    lucene:lucene构建索引,从HelloWorld到项目具体使用

    lucene构建索引,从HelloWorld到项目具体使用 ====================项目一:=================================== qianjun.lucene.first ====================项目二:=================================== qianjun....

    Lucene常用的Demo

    本篇文章将深入探讨Lucene的几个常见示例,包括`LuceneDemo`、`LuceneZJ`、`Lucene_HelloWorld`,帮助初学者快速理解Lucene的基本操作。 1. **Lucene_HelloWorld** 这个示例是入门Lucene的首选,它展示了如何创建...

    Lucene-Demo.rar Lucene分词的demo

    例如,一个英文分词器可能会将句子"Hello World"拆分为"Hello"和"World"两个术语。 在导入这个Demo项目后,开发者可以查看和学习如何实例化分词器、创建索引以及执行搜索。分词器的配置是灵活的,可以根据需求选择...

    lucence入门HelloWorld

    **Lucene 入门教程** Lucene 是一个高性能、全文本搜索库,由Apache软件基金会开发,被广泛应用于各种搜索引擎的构建。它提供了一个高级的、可扩展的、完全免费的搜索程序开发框架,使开发者能够轻松地在自己的应用...

    使用Lucene.net进行全文搜索

    例如,英文Analyzer可能会将“hello world”拆分为“hello”和“world”。 - **创建Document**: 模拟数据库中的记录,Document包含字段(Field),如标题、正文等,每个字段可以指定是否被索引和存储。 - **添加...

    全文搜索Lucene&ElasticSearch-新版.doc

    入门Lucene时,可以创建一个简单的HelloWorld程序,使用Lucene提供的API如IndexWriter进行索引的创建和维护,以及IndexSearcher进行索引的搜索。在Java环境中,需要引入相关的Lucene库,如lucene-analyzers-common、...

    lucene(HelloWord)

    《Lucene:初识搜索引擎库的“Hello World”》 Lucene,作为Apache软件基金会的顶级项目,是一款高性能、全文本检索引擎库,被广泛应用于各类搜索引擎和信息检索系统中。它提供了完整的搜索功能,包括索引、查询、...

    elk入门教程,程序员的helloworld

    Elasticsearch(简称ES)是一款强大的开源搜索引擎,它基于Apache Lucene构建,提供了一种分布式、实时、高可用的文件存储和搜索能力。其核心特性包括: 1. **分布式实时文件存储**:Elasticsearch能够分布式地存储...

    Annotated Lucene 中文版 Lucene源码剖析

    - **Hello World!** - 创建一个简单的索引,并进行基本的查询操作,这是入门Lucene的第一步。 - **Lucene Roadmap**: - 了解Lucene的发展历程及其未来规划对于开发者来说非常重要。 #### 索引文件结构 - **...

    lucene-入门

    要使用 Lucene 进行一个简单的搜索应用(Hello World),首先需要创建一个索引库,并将一些文档索引到这个库中。然后,可以通过构建查询来搜索这个索引库中的内容。具体的步骤如下: 1. **创建一个 IndexWriter ...

    lucene项目代码

    项目描述中的“Helloworld”通常代表入门级别的示例,可能包含以下步骤: 1. **创建索引**:首先,你需要创建一个索引,将数据(例如,文件内容)转换为Lucene可以理解和查询的格式。这涉及到读取文件,创建文档...

    Lucene演示

    这个"Lucene演示"可能是为了帮助初学者理解和使用Lucene进行基本操作的一个实例,例如"HelloWorld"式的简单演示。 在开始深入Lucene之前,我们先理解一下全文搜索引擎的基本概念。全文搜索引擎不同于传统的数据库...

    lucene学习,lucene对txt,pdf,html格式的学习

    在给定的代码中,`Index`方法创建了一个包含100条记录的索引,每条记录的`name`字段从`name1`到`name100`,`value`字段都为`"Hello, World!"`。然后,`Search`方法使用`QueryParser`解析查询`name*`,并打印出所有...

    lucene相关文档

    - **查询词**:单个词或词组,词组用双引号包围,如 "hello world"。 - **查询域**:指定查询的字段,如 `title:"Do it right"`。 - **通配符查询**:使用 `?` 表示一个任意字符,`*` 表示多个任意字符,但它们不...

    Struts Web设计与开发大全

    17章:Hello World类和Ant脚本及基本Web应用结构和Ant脚; 18章:Hello World类和测试类以及Struts测试工程; 19章:Struts与Hibernate结合应用; 20章:lucene1全文检索应用,直接复制到tomcat的webapps目录下...

    ES搜索快速入门

    CreateIndexResponse response = client.admin().indices().create(Requests.createIndexRequest("helloworld")).actionGet(); System.out.println("索引创建结果:" + response.isAcknowledged()); } catch ...

    lucense demo

    要搭建一个Lucene 4.0的HelloWorld Demo,我们需要以下步骤: 1. 引入库:首先,在项目中引入Lucene和IK分词器的依赖。这通常通过Maven或Gradle来完成,添加相应的依赖配置。 2. 创建索引:这是Lucene的第一步,...

    基于SSM框架构建积分系统和基本商品检索系统源码.zip

    【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用!...#### (三)[ Redis系列(一)--安装、helloworld以及读懂配置文件](http://blog.csdn.net/jack__frost/article/details/67633975

Global site tag (gtag.js) - Google Analytics