`
cfan_haifeng
  • 浏览: 122134 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

Lucene-入门

阅读更多
 
1.        lucene获取

这里我用的是lucene-3.4.0,下载地址为:http://labs.renren.com/apache-mirror//lucene/java/3.4.0/,将其放到E:\lab下,并解压缩。

 

2.        建立测试用文档

E:\lab\lucene-3.4.0\myselfdocs建立文档,以用于索引,如下:

 

 

其中,dog4_cat1.txt中内容如下:

 

 

 

表示dog4个,cat1个。

 

3.        建立索引

1.            lucene-core-3.4.0.jarcontrib/demo/lucene-demo-3.4.0.jar加入classpath

2.            运行如下命令

java org.apache.lucene.demo.IndexFiles -docs E:\lab\lucene-3.4.0\myselfdocs

结果如下图所示:

4.        搜索

1.运行java org.apache.lucene.demo.SearchFiles。并分别输入dogcat进行搜索。如下图所示。

 

很简单,如你所愿,是我们想要的效果

 

5.        测试排序

这回我们输入“dog cat”进行搜索,结果如下

 

这回,哥迷惑了据我所知, Lucene的排序算法使用的是 Vector Space Model (VSM) of Information Retrieval (向量空间模型) Boolean model(布尔模型)共同计算排序相关度的。我在以前写过一个名为《lucene排序 摘要(lucene的排序原理)》的博客时提到过。

按照我对向量空间模型的了解,显示顺序应该是

 

dog4_cat1.txt

dog3_cat1.txt

dog2_cat2.txt

 

 

 

并且,cat1.txt dog1.txt都不显示,呵呵,布尔模型吗。

 

进一步探索吧,呵呵

 

PS:建立索引、搜索完全按照http://lucene.apache.org/java/3_4_0/demo.html而来。

 

  • 大小: 19 KB
  • 大小: 5.1 KB
  • 大小: 9 KB
  • 大小: 17.7 KB
  • 大小: 8.1 KB
分享到:
评论

相关推荐

    最新全文检索 lucene-5.2.1 入门经典实例

    《最新全文检索 Lucene-5.2.1 入门经典实例》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,广泛应用于各种信息检索系统。在5.2.1版本中,Lucene提供了更为高效和强大的搜索功能,为开发者提供了构建...

    lucene-highlighter-2.9.0.jar

    lucene-highlighter-2.9.0.jar

    lucene-project.zip

    这个“lucene-project.zip”文件包含了学习Lucene全文检索程序的相关资源,是针对初学者的一个入门教程。 **Lucene的核心概念** 1. **文档(Document)**:在Lucene中,文档是信息的基本单位,可以看作是数据库中...

    全文检索 lucene-5.2.1 入门Eclipse工程实例

    Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对

    lucene-入门

    ### Lucene 入门 #### 概述 Lucene 是一个高效的、基于 Java 的全文检索库。它被设计用来支持全文检索,并且在许多情况下已经得到了广泛的应用,例如在 Windows 系统中查找文件、Eclipse 中查找帮助文档、BBS 或 ...

    lucene-2.1.0 jar包和事例

    对于初学者来说,这是获取快速入门指导的关键资源。 学习Lucene,你需要理解以下几个关键概念: 1. 分词器(Tokenizer):将输入文本分割成独立的搜索词(Token)。 2. 字段(Field):文档中的数据单元,如标题、...

    全文搜索Lucene&ElasticSearch-新版.doc

    【全文搜索Lucene & ElasticSearch】是一门关于安装和入门的课程,主要涵盖了全文检索的基本概念,Lucene和ElasticSearch的介绍,以及如何使用Java操作ElasticSearch。全文检索,顾名思义,是对非结构化数据进行搜索...

    Lucene快速入门

    ### Lucene快速入门知识点 #### 1. Lucene简介 ##### 1.1 Lucene的历史 - **创始人**: Lucene由一位资深的全文索引/检索专家开发。 - **开源历程**: 最初发布在其个人主页上,2001年10月捐赠给Apache基金会,成为...

    Lucene入门demo

    这个“Lucene入门demo”将帮助我们理解如何使用 Lucene 进行基本的索引和搜索操作。 **一、Lucene 的核心概念** 1. **索引(Indexing)**: 在 Lucene 中,索引是文档内容的预处理结果,类似于数据库中的索引。通过...

    lucene 入门

    `lucene入门小实例.txt` 文件中可能包含了一个简单的Lucene使用示例,例如: 1. 创建 `Directory` 对象,比如使用 `FSDirectory.open()` 打开一个文件系统的目录来存储索引。 2. 实例化 `Analyzer`,如使用 `...

    【大搜集:lucene学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>

    lucene入门实战.txt Lucene 的学习 .txt Lucene-2.0学习文档 .txt Lucene入门与使用 .txt lucene性能.txt 大富翁全文索引和查询的例子程序.txt 关于lucene2.0的创建、检索和删除功能的完整实现.doc web...

    lucene3.6的入门案例

    **Lucene 3.6 入门案例** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了完整的搜索功能,包括索引、查询、评分等,广泛应用于各种项目和产品中。在这个入门案例中,我们将深入理解如何...

    Lucene介绍视频教程

    Lucene入门精讲视频教程QQ截图20191025020202.png?x-oss-process=style/pnp8(39.97KB,下载次数:225)下载附件2019-10-2502:02上传〖课程介绍〗:Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的...

    lucene-starter:该存储库包含与Apache Lucene一起使用的示例

    这个"lucene-starter"项目看起来是一个入门资源,旨在帮助开发者快速上手并理解如何在自己的应用中使用Lucene。 在Lucene中,主要涉及以下几个核心概念和组件: 1. **索引**:Lucene首先需要对文档进行索引,这个...

    Lucene4.X实战类baidu搜索的大型文档海量搜索系统-01.Lucene4入门精通实战课程-概述 共23页.pptx

    【课程大纲】01.Lucene4入门精通实战课程-概述 共23页02.Lucene系统架构 共16页03.Lucene索引里有什么 共17页04.Lucene索引深入 共24页05.Lucene索引深入优化 共10页06.Lucene索引搜索 共13页07.Lucene搜索实战1 共4...

Global site tag (gtag.js) - Google Analytics