`
yingruochen
  • 浏览: 75214 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene学习入门4——优化索引库

阅读更多

索引库的优化

一、第一种方法,合并小文件,执行很多小文件要创建多次IndexWriter,所以执行大文件要比下文件快。代码如下:

package com.lucene.optimeize;

import org.apache.lucene.document.Document;

import org.testng.annotations.Test;

import com.lucene.entity.ArticleEntity;

import com.lucene.luceneutil.ArticleDocumentUtils;

import com.lucene.luceneutil.LuceneUtils;

public class Maintest {

@Test

public void testOptimeize() throws Exception{

//合并多个小文件为一个大文件,适合于批量操作

LuceneUtils.getIndexWriter().optimize();

}

@Test

public void testOptimeize2() throws Exception {

//设置当小文件达到多少个时,就自动合并多个小文件为一个大文件

LuceneUtils.getIndexWriter().setMergeFactor(5);

//模拟存储数据

ArticleEntity ae = new ArticleEntity();

ae.setId(1);

ae.setTitle("luncen测试");

ae.setContent("Lucene的原理......");

Document doc = ArticleDocumentUtils.Article2Document(ae);

LuceneUtils.getIndexWriter().addDocument(doc);

}

}
 

 

 

分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    lucene-入门

    全文检索的思路包括提取非结构化数据的信息、重新组织这些信息并变成一定的结构——索引,以提高搜索速度。 #### Lucene 架构原理 Lucene 作为一个全文检索库,提供了查询引擎和索引引擎的完整实现,以及部分文本...

    Apache Lucene3.0 入门实例介绍

    这个入门实例将引导我们了解如何使用Lucene 3.0版本进行基本的索引和搜索操作。以下是对Lucene 3.0关键知识点的详细讲解: 1. **Lucene的架构**: Lucene的核心组件包括文档(Document)、字段(Field)、索引...

    lucene_demo例子

    4. **倒排索引**:了解Lucene的核心机制——倒排索引,它是如何快速定位到相关文档的。 5. **查询构造**:学习使用QueryParser创建标准查询,以及如何使用TermQuery、BooleanQuery、WildcardQuery、PhraseQuery等...

    lucene3.6.1 经典案例 入门教程

    《Lucene 3.6.1经典案例入门教程——源码与工具解析》 Lucene,作为Apache软件基金会的一个开放源代码项目,是一款强大的全文搜索引擎库。它为开发者提供了在Java应用程序中实现全文检索功能的高级工具。在本文中,...

    Java搜索工具——Lucene实例总结(一)

    Java搜索工具——Lucene实例总结(一) 在Java开发中,搜索引擎已经成为不可或缺的一部分,而Apache Lucene正是一个强大的全文搜索引擎库。这篇博文将带你深入理解Lucene的基本概念和使用方式,帮助你快速入门并掌握...

    lucene in action第二版下载

    通过以上介绍可以看出,《Lucene In Action》第二版是一本全面介绍了Lucene各个方面的书籍,不仅适合初学者入门学习,也非常适合作为高级开发者的参考手册。无论是想要深入了解Lucene的工作原理还是寻求解决特定问题...

    lusence的一个demo和文档

    《Lucene快速入门指南——基于Lusence的Demo与文档解析》 在信息化时代,数据检索已成为日常工作中不可或缺的一部分。Lucene,作为一个强大的全文搜索引擎库,由Apache软件基金会开发,被广泛应用于各种信息检索...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    在《开发自己的搜索引擎》一书中,通过`ch2-lucene入门小例子`,读者可以了解到如何使用Lucene 2.0创建简单的搜索引擎,例如建立索引、执行搜索等基本操作。而`myReserch-可用的网络搜索引擎`可能包含一个完整的搜索...

    最新全文检索系统开源lucene资料大全(pdf格式)

    在本资料包中,重点是开源的全文检索库——Lucene。 **Lucene简介** Lucene是由Apache软件基金会开发的一个高性能、全文本搜索库,它提供了基础的索引和搜索功能,同时也支持高级搜索特性,如布尔运算、短语搜索、...

    解密搜索引擎技术实战++Lucene&Java;精华版_.pdf

    《解密搜索引擎技术实战——Lucene&Java精华版》是一本深入探讨搜索引擎技术的专业书籍,主要聚焦于开源全文搜索引擎库Lucene以及与之配合的Java编程语言。这本书旨在帮助读者理解搜索引擎的工作原理,并通过实际...

    Lucene In Action second edition

    本书主要介绍了 Apache Lucene 3.0 的最新特性与应用方法,适合所有对 Lucene 技术感兴趣的学习者。 #### 二、Lucene 概述 ##### 2.1 什么是 Lucene? Apache Lucene 是一个高性能、全功能的文本搜索引擎库。它...

    数据结构算法

    索引操作 8天学通MongoDB——第三天 细说高级操作 8天学通MongoDB——第二天 细说增删查改 8天学通MongoDB——第一天 基础入门 UML系列(4)团队沟通利器之UML——类图 团队沟通利器之UML—— 序列图 团队沟通利器之...

    lucene笔记

    - **存储索引**: 将构建好的索引保存至索引库中。 - **搜索流程**: - **查询请求**: 用户输入查询条件。 - **索引查询**: 根据查询条件在索引库中查找相关的文档。 - **结果展示**: 返回与查询条件相匹配的结果...

    入门搜索引擎(原码+环境jar包+运行说明文档)

    搜索引擎是信息检索的重要工具,本资源提供了一个入门级的搜索引擎实现,涵盖了网络爬虫和基于Lucene的搜索索引构建。下面将详细讲解其中涉及的关键技术。 首先,我们来看看网络爬虫部分。网络爬虫是一种自动抓取...

    Hadoop入门

    Hadoop的源起——Lucene ,Doug Cutting开创的开源软件,用java书写代码,实现与Google类似的全文搜索功能,提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎 。

    02_尚硅谷大数据技术之Hadoop(入门)V3.3.pdf

    Hadoop 的发展历史可以追溯到 2001 年, Doug Cutting 在 Lucene 框架基础上进行优化升级,查询引擎和索引引擎,并在 2003-2004 年学习和模仿 Google 解决这些问题的办法,微型版 Nutch。2005 年,Hadoop 作为 ...

    nutch入门学习

    ### Nutch 入门学习知识点总结 #### 1. Nutch 简介 ##### 1.1 什么是 Nutch Nutch 是一个基于 Java 的开源搜索引擎项目,它提供了构建和运行个人或组织搜索引擎所需的所有工具。通过 Nutch,用户不仅能够定制自己...

    HadoopHDFS架构概述推荐系统框架图

    Hadoop 的发展历史:Hadoop 的创始人 Doug Cutting,为了实现与 Google 类似的全文搜索功能,他在 Lucene 框架基础上进行优化升级,查询引擎和索引引擎。2001 年年底 Lucene 成为 Apache 基金会的一个子项目。对于...

    IKAnalyzer中文分词器V3.1.1使用手册

    - **查询分析器**:IKAnalyzer还提供了一个专门针对Lucene全文检索优化的查询分析器——**IKQueryParser**。该分析器采用了歧义分析算法来优化查询关键词的搜索排列组合,显著提高了Lucene检索的准确性。 ##### 1.2...

    neo4j入门资料汇总

    9. 使用键值和关系进行索引为读操作进行优化 10. 支持事务(用 Java api) 11. 使用 Gremlin 图形遍历语言支持 12. 支持 Groovy 脚本 13. 支持在线备份,高级监控及高可靠性支持使用 AGPL/商业许可 Neo4j 的数据...

Global site tag (gtag.js) - Google Analytics