1. lucene获取
这里我用的是lucene-3.4.0,下载地址为:http://labs.renren.com/apache-mirror//lucene/java/3.4.0/,将其放到E:\lab下,并解压缩。
2. 建立测试用文档
在E:\lab\lucene-3.4.0\myselfdocs建立文档,以用于索引,如下:
其中,dog4_cat1.txt中内容如下:
表示dog有4个,cat有1个。
3. 建立索引
1. 将lucene-core-3.4.0.jar、contrib/demo/lucene-demo-3.4.0.jar加入classpath。
2. 运行如下命令
java org.apache.lucene.demo.IndexFiles -docs E:\lab\lucene-3.4.0\myselfdocs
结果如下图所示:
4. 搜索
1.运行java org.apache.lucene.demo.SearchFiles。并分别输入dog、cat进行搜索。如下图所示。
很简单,如你所愿,是我们想要的效果
5. 测试排序
这回我们输入“dog cat”进行搜索,结果如下
这回,哥迷惑了。据我所知, Lucene的排序算法使用的是 Vector Space Model (VSM) of Information Retrieval (向量空间模型)和 Boolean model(布尔模型)共同计算排序相关度的。我在以前写过一个名为《lucene排序 摘要(lucene的排序原理)》的博客时提到过。
按照我对向量空间模型的了解,显示顺序应该是
dog4_cat1.txt
dog3_cat1.txt
dog2_cat2.txt
|
并且,cat1.txt 和 dog1.txt都不显示,呵呵,布尔模型吗。
进一步探索吧,呵呵
PS:建立索引、搜索完全按照http://lucene.apache.org/java/3_4_0/demo.html而来。
- 大小: 19 KB
- 大小: 5.1 KB
- 大小: 9 KB
- 大小: 17.7 KB
- 大小: 8.1 KB
分享到:
相关推荐
《最新全文检索 Lucene-5.2.1 入门经典实例》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,广泛应用于各种信息检索系统。在5.2.1版本中,Lucene提供了更为高效和强大的搜索功能,为开发者提供了构建...
lucene-highlighter-2.9.0.jar
这个“lucene-project.zip”文件包含了学习Lucene全文检索程序的相关资源,是针对初学者的一个入门教程。 **Lucene的核心概念** 1. **文档(Document)**:在Lucene中,文档是信息的基本单位,可以看作是数据库中...
Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对
### Lucene 入门 #### 概述 Lucene 是一个高效的、基于 Java 的全文检索库。它被设计用来支持全文检索,并且在许多情况下已经得到了广泛的应用,例如在 Windows 系统中查找文件、Eclipse 中查找帮助文档、BBS 或 ...
对于初学者来说,这是获取快速入门指导的关键资源。 学习Lucene,你需要理解以下几个关键概念: 1. 分词器(Tokenizer):将输入文本分割成独立的搜索词(Token)。 2. 字段(Field):文档中的数据单元,如标题、...
【全文搜索Lucene & ElasticSearch】是一门关于安装和入门的课程,主要涵盖了全文检索的基本概念,Lucene和ElasticSearch的介绍,以及如何使用Java操作ElasticSearch。全文检索,顾名思义,是对非结构化数据进行搜索...
### Lucene快速入门知识点 #### 1. Lucene简介 ##### 1.1 Lucene的历史 - **创始人**: Lucene由一位资深的全文索引/检索专家开发。 - **开源历程**: 最初发布在其个人主页上,2001年10月捐赠给Apache基金会,成为...
这个“Lucene入门demo”将帮助我们理解如何使用 Lucene 进行基本的索引和搜索操作。 **一、Lucene 的核心概念** 1. **索引(Indexing)**: 在 Lucene 中,索引是文档内容的预处理结果,类似于数据库中的索引。通过...
`lucene入门小实例.txt` 文件中可能包含了一个简单的Lucene使用示例,例如: 1. 创建 `Directory` 对象,比如使用 `FSDirectory.open()` 打开一个文件系统的目录来存储索引。 2. 实例化 `Analyzer`,如使用 `...
lucene入门实战.txt Lucene 的学习 .txt Lucene-2.0学习文档 .txt Lucene入门与使用 .txt lucene性能.txt 大富翁全文索引和查询的例子程序.txt 关于lucene2.0的创建、检索和删除功能的完整实现.doc web...
**Lucene 3.6 入门案例** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了完整的搜索功能,包括索引、查询、评分等,广泛应用于各种项目和产品中。在这个入门案例中,我们将深入理解如何...
Lucene入门精讲视频教程QQ截图20191025020202.png?x-oss-process=style/pnp8(39.97KB,下载次数:225)下载附件2019-10-2502:02上传〖课程介绍〗:Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的...
这个"lucene-starter"项目看起来是一个入门资源,旨在帮助开发者快速上手并理解如何在自己的应用中使用Lucene。 在Lucene中,主要涉及以下几个核心概念和组件: 1. **索引**:Lucene首先需要对文档进行索引,这个...
【课程大纲】01.Lucene4入门精通实战课程-概述 共23页02.Lucene系统架构 共16页03.Lucene索引里有什么 共17页04.Lucene索引深入 共24页05.Lucene索引深入优化 共10页06.Lucene索引搜索 共13页07.Lucene搜索实战1 共4...