1. lucene获取
这里我用的是lucene-3.4.0,下载地址为:http://labs.renren.com/apache-mirror//lucene/java/3.4.0/,将其放到E:\lab下,并解压缩。
2. 建立测试用文档
在E:\lab\lucene-3.4.0\myselfdocs建立文档,以用于索引,如下:
其中,dog4_cat1.txt中内容如下:
表示dog有4个,cat有1个。
3. 建立索引
1. 将lucene-core-3.4.0.jar、contrib/demo/lucene-demo-3.4.0.jar加入classpath。
2. 运行如下命令
java org.apache.lucene.demo.IndexFiles -docs E:\lab\lucene-3.4.0\myselfdocs
结果如下图所示:
4. 搜索
1.运行java org.apache.lucene.demo.SearchFiles。并分别输入dog、cat进行搜索。如下图所示。
很简单,如你所愿,是我们想要的效果
5. 测试排序
这回我们输入“dog cat”进行搜索,结果如下
这回,哥迷惑了。据我所知, Lucene的排序算法使用的是 Vector Space Model (VSM) of Information Retrieval (向量空间模型)和 Boolean model(布尔模型)共同计算排序相关度的。我在以前写过一个名为《lucene排序 摘要(lucene的排序原理)》的博客时提到过。
按照我对向量空间模型的了解,显示顺序应该是
dog4_cat1.txt
dog3_cat1.txt
dog2_cat2.txt
|
并且,cat1.txt 和 dog1.txt都不显示,呵呵,布尔模型吗。
进一步探索吧,呵呵
PS:建立索引、搜索完全按照http://lucene.apache.org/java/3_4_0/demo.html而来。
- 大小: 19 KB
- 大小: 5.1 KB
- 大小: 9 KB
- 大小: 17.7 KB
- 大小: 8.1 KB
分享到:
相关推荐
《最新全文检索 Lucene-5.2.1 入门经典实例》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,广泛应用于各种信息检索系统。在5.2.1版本中,Lucene提供了更为高效和强大的搜索功能,为开发者提供了构建...
lucene-highlighter-2.9.0.jar
这个“lucene-project.zip”文件包含了学习Lucene全文检索程序的相关资源,是针对初学者的一个入门教程。 **Lucene的核心概念** 1. **文档(Document)**:在Lucene中,文档是信息的基本单位,可以看作是数据库中...
Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对
### Lucene 入门 #### 概述 Lucene 是一个高效的、基于 Java 的全文检索库。它被设计用来支持全文检索,并且在许多情况下已经得到了广泛的应用,例如在 Windows 系统中查找文件、Eclipse 中查找帮助文档、BBS 或 ...
对于初学者来说,这是获取快速入门指导的关键资源。 学习Lucene,你需要理解以下几个关键概念: 1. 分词器(Tokenizer):将输入文本分割成独立的搜索词(Token)。 2. 字段(Field):文档中的数据单元,如标题、...
【全文搜索Lucene & ElasticSearch】是一门关于安装和入门的课程,主要涵盖了全文检索的基本概念,Lucene和ElasticSearch的介绍,以及如何使用Java操作ElasticSearch。全文检索,顾名思义,是对非结构化数据进行搜索...
### Lucene快速入门知识点 #### 1. Lucene简介 ##### 1.1 Lucene的历史 - **创始人**: Lucene由一位资深的全文索引/检索专家开发。 - **开源历程**: 最初发布在其个人主页上,2001年10月捐赠给Apache基金会,成为...
这个“Lucene入门demo”将帮助我们理解如何使用 Lucene 进行基本的索引和搜索操作。 **一、Lucene 的核心概念** 1. **索引(Indexing)**: 在 Lucene 中,索引是文档内容的预处理结果,类似于数据库中的索引。通过...
`lucene入门小实例.txt` 文件中可能包含了一个简单的Lucene使用示例,例如: 1. 创建 `Directory` 对象,比如使用 `FSDirectory.open()` 打开一个文件系统的目录来存储索引。 2. 实例化 `Analyzer`,如使用 `...
lucene入门实战.txt Lucene 的学习 .txt Lucene-2.0学习文档 .txt Lucene入门与使用 .txt lucene性能.txt 大富翁全文索引和查询的例子程序.txt 关于lucene2.0的创建、检索和删除功能的完整实现.doc web...
**Lucene 3.6 入门案例** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了完整的搜索功能,包括索引、查询、评分等,广泛应用于各种项目和产品中。在这个入门案例中,我们将深入理解如何...
标题与描述:“Lucene简单入门程序实例”这一标题与描述明确指出文章将引导读者通过一个实际的示例来了解和掌握Lucene的基本操作。Lucene是一个高性能、全功能的文本搜索引擎库,它允许用户对文档进行索引和搜索。本...
Lucene入门精讲视频教程QQ截图20191025020202.png?x-oss-process=style/pnp8(39.97KB,下载次数:225)下载附件2019-10-2502:02上传〖课程介绍〗:Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的...
这个"lucene-starter"项目看起来是一个入门资源,旨在帮助开发者快速上手并理解如何在自己的应用中使用Lucene。 在Lucene中,主要涉及以下几个核心概念和组件: 1. **索引**:Lucene首先需要对文档进行索引,这个...