`
yingruochen
  • 浏览: 75126 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene学习入门4——优化索引库

阅读更多

索引库的优化

一、第一种方法,合并小文件,执行很多小文件要创建多次IndexWriter,所以执行大文件要比下文件快。代码如下:

package com.lucene.optimeize;

import org.apache.lucene.document.Document;

import org.testng.annotations.Test;

import com.lucene.entity.ArticleEntity;

import com.lucene.luceneutil.ArticleDocumentUtils;

import com.lucene.luceneutil.LuceneUtils;

public class Maintest {

@Test

public void testOptimeize() throws Exception{

//合并多个小文件为一个大文件,适合于批量操作

LuceneUtils.getIndexWriter().optimize();

}

@Test

public void testOptimeize2() throws Exception {

//设置当小文件达到多少个时,就自动合并多个小文件为一个大文件

LuceneUtils.getIndexWriter().setMergeFactor(5);

//模拟存储数据

ArticleEntity ae = new ArticleEntity();

ae.setId(1);

ae.setTitle("luncen测试");

ae.setContent("Lucene的原理......");

Document doc = ArticleDocumentUtils.Article2Document(ae);

LuceneUtils.getIndexWriter().addDocument(doc);

}

}
 

 

 

分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    lucene-入门

    全文检索的思路包括提取非结构化数据的信息、重新组织这些信息并变成一定的结构——索引,以提高搜索速度。 #### Lucene 架构原理 Lucene 作为一个全文检索库,提供了查询引擎和索引引擎的完整实现,以及部分文本...

    Apache Lucene3.0 入门实例介绍

    这个入门实例将引导我们了解如何使用Lucene 3.0版本进行基本的索引和搜索操作。以下是对Lucene 3.0关键知识点的详细讲解: 1. **Lucene的架构**: Lucene的核心组件包括文档(Document)、字段(Field)、索引...

    lucene_demo例子

    4. **倒排索引**:了解Lucene的核心机制——倒排索引,它是如何快速定位到相关文档的。 5. **查询构造**:学习使用QueryParser创建标准查询,以及如何使用TermQuery、BooleanQuery、WildcardQuery、PhraseQuery等...

    lucene3.6.1 经典案例 入门教程

    《Lucene 3.6.1经典案例入门教程——源码与工具解析》 Lucene,作为Apache软件基金会的一个开放源代码项目,是一款强大的全文搜索引擎库。它为开发者提供了在Java应用程序中实现全文检索功能的高级工具。在本文中,...

    Java搜索工具——Lucene实例总结(一)

    Java搜索工具——Lucene实例总结(一) 在Java开发中,搜索引擎已经成为不可或缺的一部分,而Apache Lucene正是一个强大的全文搜索引擎库。这篇博文将带你深入理解Lucene的基本概念和使用方式,帮助你快速入门并掌握...

    lucene in action第二版下载

    通过以上介绍可以看出,《Lucene In Action》第二版是一本全面介绍了Lucene各个方面的书籍,不仅适合初学者入门学习,也非常适合作为高级开发者的参考手册。无论是想要深入了解Lucene的工作原理还是寻求解决特定问题...

    lusence的一个demo和文档

    《Lucene快速入门指南——基于Lusence的Demo与文档解析》 在信息化时代,数据检索已成为日常工作中不可或缺的一部分。Lucene,作为一个强大的全文搜索引擎库,由Apache软件基金会开发,被广泛应用于各种信息检索...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    在《开发自己的搜索引擎》一书中,通过`ch2-lucene入门小例子`,读者可以了解到如何使用Lucene 2.0创建简单的搜索引擎,例如建立索引、执行搜索等基本操作。而`myReserch-可用的网络搜索引擎`可能包含一个完整的搜索...

    最新全文检索系统开源lucene资料大全(pdf格式)

    在本资料包中,重点是开源的全文检索库——Lucene。 **Lucene简介** Lucene是由Apache软件基金会开发的一个高性能、全文本搜索库,它提供了基础的索引和搜索功能,同时也支持高级搜索特性,如布尔运算、短语搜索、...

    解密搜索引擎技术实战++Lucene&Java;精华版_.pdf

    《解密搜索引擎技术实战——Lucene&Java精华版》是一本深入探讨搜索引擎技术的专业书籍,主要聚焦于开源全文搜索引擎库Lucene以及与之配合的Java编程语言。这本书旨在帮助读者理解搜索引擎的工作原理,并通过实际...

    Lucene In Action second edition

    本书主要介绍了 Apache Lucene 3.0 的最新特性与应用方法,适合所有对 Lucene 技术感兴趣的学习者。 #### 二、Lucene 概述 ##### 2.1 什么是 Lucene? Apache Lucene 是一个高性能、全功能的文本搜索引擎库。它...

    数据结构算法

    索引操作 8天学通MongoDB——第三天 细说高级操作 8天学通MongoDB——第二天 细说增删查改 8天学通MongoDB——第一天 基础入门 UML系列(4)团队沟通利器之UML——类图 团队沟通利器之UML—— 序列图 团队沟通利器之...

    lucene笔记

    - **存储索引**: 将构建好的索引保存至索引库中。 - **搜索流程**: - **查询请求**: 用户输入查询条件。 - **索引查询**: 根据查询条件在索引库中查找相关的文档。 - **结果展示**: 返回与查询条件相匹配的结果...

    入门搜索引擎(原码+环境jar包+运行说明文档)

    搜索引擎是信息检索的重要工具,本资源提供了一个入门级的搜索引擎实现,涵盖了网络爬虫和基于Lucene的搜索索引构建。下面将详细讲解其中涉及的关键技术。 首先,我们来看看网络爬虫部分。网络爬虫是一种自动抓取...

    Hadoop入门

    Hadoop的源起——Lucene ,Doug Cutting开创的开源软件,用java书写代码,实现与Google类似的全文搜索功能,提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎 。

    02_尚硅谷大数据技术之Hadoop(入门)V3.3.pdf

    Hadoop 的发展历史可以追溯到 2001 年, Doug Cutting 在 Lucene 框架基础上进行优化升级,查询引擎和索引引擎,并在 2003-2004 年学习和模仿 Google 解决这些问题的办法,微型版 Nutch。2005 年,Hadoop 作为 ...

    nutch入门学习

    ### Nutch 入门学习知识点总结 #### 1. Nutch 简介 ##### 1.1 什么是 Nutch Nutch 是一个基于 Java 的开源搜索引擎项目,它提供了构建和运行个人或组织搜索引擎所需的所有工具。通过 Nutch,用户不仅能够定制自己...

    HadoopHDFS架构概述推荐系统框架图

    Hadoop 的发展历史:Hadoop 的创始人 Doug Cutting,为了实现与 Google 类似的全文搜索功能,他在 Lucene 框架基础上进行优化升级,查询引擎和索引引擎。2001 年年底 Lucene 成为 Apache 基金会的一个子项目。对于...

    neo4j入门资料汇总

    9. 使用键值和关系进行索引为读操作进行优化 10. 支持事务(用 Java api) 11. 使用 Gremlin 图形遍历语言支持 12. 支持 Groovy 脚本 13. 支持在线备份,高级监控及高可靠性支持使用 AGPL/商业许可 Neo4j 的数据...

    IKAnalyzer中文分词器V3.1.1使用手册

    - **查询分析器**:IKAnalyzer还提供了一个专门针对Lucene全文检索优化的查询分析器——**IKQueryParser**。该分析器采用了歧义分析算法来优化查询关键词的搜索排列组合,显著提高了Lucene检索的准确性。 ##### 1.2...

Global site tag (gtag.js) - Google Analytics