lucene索引文件过大，如何实现分割索引库 - ITeye问答

问答首页 → Java企业应用

0 0

lucene索引文件过大，如何实现分割索引库10

我的索引库文件index超过2g,且有继续增长的可能，如何实现索引库文件的分割，或有什么方式可以确保程序的正常动作

2012年8月28日 13:10

范胜利
20
0 0 2

1个答案按时间排序按投票排序

0 0

是不是需要考虑索引的分布式，其实2g的索引并不是很大，
有网友评论：索引文件10G时，搜索速度不会太慢的，我目前做的10G以内，用PC机安装虚拟机测试，检索速度1秒左右，看看你是不是太多commit操作和optimize等，这两个操作对索引压力大。

地址： http://topic.csdn.net/u/20071120/19/8a2f785a-8990-42ec-adfc-d75dee478dab.html

按你的想法来说，应该是想做索引分布式集群：有几篇文章参考下：

http://www.blogjava.net/leekiang/archive/2010/11/19/338497.html

分布式索引：http://www.cnblogs.com/wycg1984/archive/2010/07/13/1776616.html

2012年8月29日 09:22

navy0168
136
0 0 7

添加评论

相关推荐

Lucene索引器实例: **Lucene索引器实例详解** Lucene是一个高性能、全文本搜索库，由Apache软件基金会开发，被广泛应用于各种搜索引擎的构建。它提供了一个高级的、灵活的、可扩展的接口，使得开发者能够轻松地在应用程序中实现全文...

lucene实现索引查询: Lucene 是一个高性能、全文本搜索库，被广泛用于构建高效的搜索引擎和信息检索系统。它提供了完整的搜索功能，包括分析、索引、查询以及结果排序等。在Java开发中，Lucene 提供了丰富的API来简化这些操作。以下是...

lucene并行索引: 3. **实现细节**：开发具体的代码实现，如文档分割逻辑、节点间通信协议、合并索引算法等。 4. **测试优化**：通过模拟真实环境进行测试，评估系统性能，并针对发现的问题进行优化调整。 #### 六、结论综上所述，...

如何将Lucene索引写入Hadoop？: 标题 "如何将Lucene索引写入Hadoop" 指涉的是在大数据处理场景下，如何利用Apache Lucene的全文检索功能与Apache Hadoop的分布式计算能力相结合，实现高效的数据检索。Apache Lucene是一个高性能、全文本搜索库，而...

LUCENE索引搜索数据库技术汇总: - **数据库集成**: 通过JDBC或其他方式将数据库中的数据导入Lucene索引，实现高效全文检索。 - **联合查询（Hybrid Search）**: 结合SQL查询与Lucene的全文搜索，提供更强大的搜索能力。综上所述，Lucene提供了...

经典的lucene实例代码及详细解析以及lucene结构流程介绍: 索引文件是Lucene索引的物理存储单元，词典是词项的集合，倒排索引是词项到文档的映射关系。在Lucene中，索引文件是以目录形式存储的，每个索引文件对应一个文档集合。词典是Lucene索引的核心组件，它存储了所有的...

lucene索引: 《Lucene索引详解》在信息技术领域，搜索引擎扮演着至关重要的角色，而Lucene作为开源的全文检索库，是构建高效、可扩展搜索功能的首选工具。本文将深入探讨Lucene索引的工作原理和核心概念，特别是针对中文词汇...

Lucene4.X实战类baidu搜索的大型文档海量搜索系统-04.Lucene索引深入共24页.pptx: 【Lucene索引深入】 Lucene是一个开源的全文搜索引擎库，它允许开发者构建高效、可扩展的搜索功能。在深入理解Lucene索引的过程中，我们需要掌握以下几个关键知识点： 1. **索引片段（Segments）**：索引由一系列...

data.rar学习lucene需要的数据文件: 数据文件中的每个文件都会被读取，内容被分割成单词，然后每个单词与它出现的文件位置关联，形成索引。 2. **查询处理**：用户输入的查询会被转换成适合索引的格式，然后在索引中查找匹配项。Lucene支持多种查询...

Lucene检索文本，建立索引: 首先，**Lucene** 是一个开源的Java库，它提供了完整的搜索功能，包括分词、索引创建、查询解析和结果排序。它的核心功能是能够对文本进行分析，将文本拆分成有意义的单元——称为“词项”（tokens），然后创建一个...

基于Lucene和HDFS的PB级数据索引、搜索、存储系统.zip: 3. **Lucene索引分布**：每个HDFS节点上的数据都会被本地化的Lucene实例进行索引，确保索引与数据的物理位置相对应，减少网络传输开销。 4. **Shard和Replication**：Lucene的索引可能会被分成多个碎片（shards），...

lucene 实现类似百度搜索: - 压缩索引：可以使用 Lucene 的压缩功能减小索引文件大小。 4. **更新与删除（Updating & Deleting）** - 更新文档：创建新的文档，使用相同 ID 替换旧文档。 - 删除文档：通过文档编号，使用 `IndexWriter` 的...

全文检索原理及Lucene实之搜索: #### Lucene索引实例详解下面通过一个简单的代码示例来进一步了解Lucene的索引过程： ```java public static void LuceneIndex() throws IOException { String indexPath = "d:\\indexTest"; Directory ...

lucene全文索引: 这个“lucene全文索引”可能是包含Lucene的相关示例代码、文档或者配置文件，帮助用户更好地理解和使用Lucene。 **1. Lucene 的基本概念** - **索引**: 在Lucene中，索引是预处理步骤，将原始文本转换为倒排索引...

luceneDemo: - `META-INF`: 存放元数据，如应用的 MANIFEST.MF 文件，可能与 Lucene 索引的存储位置或元数据有关。 **实现流程** 1. **初始化索引**: 创建索引目录，使用 IndexWriter 将文档数据写入索引。 2. **查询处理**: ...

lucene工程，分词、索引: Lucene是一个开源的全文搜索引擎库，由Apache软件基金会开发并维护。它提供了高效、可扩展的文本搜索功能，被广泛应用于各种系统和应用中。在"lucene工程"中，我们可以通过实例学习到如何利用Lucene进行分词和构建...

依赖Lucene的电话号码查询优化: 因此，在分析查询字符串时，应确保查询的电话号码与索引中的号码完全一致，可以使用Analyzer的KeywordTokenizer，确保输入不被分割。 3. **字段处理**：电话号码可以被视为一种特殊类型的数据，可以为其设置专门的...

Annotated Lucene 中文版 Lucene源码剖析: 《Annotated Lucene 中文版 Lucene源码剖析》是一本深入探讨Apache Lucene的书籍，专注于源码解析，帮助读者理解这个强大的全文搜索引擎库的工作原理。Lucene是一款开源的Java库，它提供了高效的文本搜索功能，被...

Ask-but

我的问答 FAQ | 勋章

相关推荐

已解决问题

未解决问题

排行榜

查看全部排名>>

Global site tag (gtag.js) - Google Analytics