- 浏览: 561743 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (478)
- lucene (45)
- oracle (19)
- nutch (2)
- blog (2)
- 垂直搜索 (19)
- java综合 (89)
- spring (15)
- Hibernate (9)
- Struts (9)
- Hadoop (16)
- Mysql (12)
- nosql (10)
- Linux (3)
- MyEclipse (4)
- Ant (1)
- 设计模式 (19)
- JBPM (1)
- JSP (1)
- HtmlParser (5)
- SVN (2)
- 插件 (2)
- 收藏 (7)
- Others (1)
- Heritrix (18)
- Solr (4)
- 主题爬虫 (31)
- 内存数据库 (24)
- 分布式与海量数据 (32)
- httpclient (14)
- Tomcat (1)
- 面试宝典 (6)
- Python (14)
- 数据挖掘 (1)
- 算法 (6)
- 其他 (4)
- JVM (12)
- Redis (18)
最新评论
-
hanjiyun:
本人水平还有待提高,进步空间很大,看这些文章给我有很大的指导作 ...
JVM的内存管理 Ⅲ -
liuxinglanyue:
四年后的自己:这种方法 不靠谱。 使用javaagent的方式 ...
计算Java对象占用内存空间的大小(对于32位虚拟机而言) -
jaysoncn:
附件在哪里啊test.NoCertificationHttps ...
使用HttpClient过程中常见的一些问题 -
231fuchenxi:
你好,有redis,memlink,mysql的测试代码吗?可 ...
MemLink 性能测试 -
guyue1015:
[color=orange][/color][size=lar ...
JAVA同步机制
分类为[lucene]的文章
发表评论
-
有关Lucene的问题(收藏)推荐
2010-12-30 21:02 1105有关Lucene的问题(1):为 ... -
Lucene 学习总结(收藏)推荐
2010-12-30 20:54 1554Lucene学习总结之一:全文检索的基本原理 ... -
基于Lucene的Compass 资源(收藏)
2010-12-29 18:29 11391.2、Compass相关网上资源 1、官方网站1: http ... -
Lucene 3.0.2索引文件官方文档(二)
2010-12-28 22:36 1004Deletable File A writer dy ... -
Lucene 3.0.2索引文件官方文档(一)
2010-12-28 22:34 1456Apache Lucene - Index File ... -
Lucene 3.0 索引文件学习总结(收藏)
2010-12-28 22:28 935lucene学习1——词域信息 ... -
Lucene 字符编码问题
2010-12-27 20:29 990现在如果一个txt文件中包含了ANSI编码的文本文件和Uni ... -
Lucene 字符编码问题
2010-12-27 20:20 1026现在如果一个txt文件中包含了ANSI编码的文本文件和Unic ... -
Annotated Lucene(源码剖析中文版)
2010-12-25 22:52 1256Apache Lucene是一个高性能(high-pe ... -
Lucene 学习推荐博客
2010-12-25 22:42 1030深未来deepfuturelx http://deepfut ... -
Lucene3.0 初窥 总结(收藏)
2010-12-25 22:16 1806【Lucene3.0 初窥】全文检索的基本原理 ... -
转:基于lucene实现自己的推荐引擎
2010-12-17 17:05 1052采用基于数据挖掘的 ... -
加速 lucene 的搜索速度 ImproveSearchingSpeed(二)
2010-12-17 17:01 1031本文 为简单翻译,原文在:http://wiki.apac ... -
加速 lucene 索引建立速度 ImproveIndexingSpeed
2010-12-17 16:58 1070本文 只是简单的翻译,原文 在 http://wiki.a ... -
lucene 3.0 中的demo项目部署
2010-12-15 22:02 969转自:bjqincy 1 在myEclipise 建立 ... -
Lucene 3.0.2 源码 - final class Document
2010-12-14 22:33 887package org.apache.lucene.do ... -
Lucene 3.0.2 源码 - final class Field
2010-12-14 22:29 950package org.apache.lucene.do ... -
Lucene 3.0.2 源码 - abstract class AbstractField
2010-12-14 22:28 1038package org.apache.lucene.do ... -
Lucene 3.0.2 源码 - interface Fieldable
2010-12-14 22:28 1172package org.apache.lucene.do ... -
LinkedIn公司实现的实时搜索引擎Zoie
2010-12-14 21:02 872转自:forfuture1978 一 ...
相关推荐
《关于Lucene的词典FST深入剖析》这篇文章是由申艳超撰写的,主要探讨了Apache Lucene这个全文搜索引擎库中的一个关键数据结构——有限状态转换器(Finite State Transducer,简称FST)。FST在Lucene中被用于构建和...
本文翻译了论文"Scale-up x Scale-out: A Case Study using Nutch/Lucene",介绍了计算机专业领域中关于Lucene相关的知识点。 Scale-up vs Scale-out 论文中讨论了两个相对的方法:向上扩展(Scale-up)和向外...
在本文中,我们将探讨如何使用Lucene建立数据库索引,并分享一些在实践过程中的经验和教训。Lucene是一个高性能、全文本搜索库,广泛用于...如果有任何问题或需要进一步讨论,可以通过邮件766003546@qq.com与作者交流。
此外,书中还会讨论Lucene的更新和维护,包括如何在已有的索引上添加、删除或修改文档,以及如何进行索引优化。这涉及到IndexWriter、SegmentMerger等类,它们确保了索引的一致性和性能。 在实际应用中,Lucene通常...
### 关于Lucene和Solr的专业资料概览 #### 标题解读 - **标题**:“一个专业搜索公司关于Lucene和Solr资料” - 该标题表明这份资料是针对专业人士编写的,主要聚焦于Lucene和Solr这两款流行的信息检索系统。 ####...
4. **查询处理**:讲解了如何构建各种查询表达式,如布尔查询、短语查询、范围查询等,并且讨论了评分机制和查询优化技巧。 5. **高级主题**:书中涵盖了高级话题,如近实时搜索、分布式搜索(通过Solr实现)、复杂...
现在,让我们详细讨论如何在Lucene中删除索引。 首先,删除索引是Lucene中一个关键的操作,因为随着时间的推移,数据可能会更新或过时,此时就需要删除旧的索引信息。Lucene的索引删除过程并不像传统的文件系统删除...
- **多语言支持**:讨论了如何将Lucene移植到其他编程环境中,比如.NET或Python,以及移植过程中可能遇到的问题。 - **章节10:案例研究** - **真实应用场景**:通过多个具体案例,展示了Lucene在实际项目中的应用...
本文将主要围绕Java Lucene进行深入探讨,并基于提供的“Lucene学习源码.rar”文件中的“Lucene视频教程_讲解部分源码”展开讨论。 一、Lucene核心概念 1. 文档(Document):Lucene中的基本单位,用于存储待检索...
`05_lucene_plugin`可能讨论了Lucene的扩展机制。Lucene允许开发人员编写自定义插件以增强其功能,如自定义过滤器、查询解析器等。这使得Lucene具有极高的灵活性,能适应各种特定场景。 **7. Solr的引入** `06_...
下面,我们将详细讨论Lucene的一些核心概念和实战技巧。 1. **Lucene简介** Lucene是Java编写的一个开源全文检索库,由Doug Cutting创建。它提供了索引和搜索大量文本数据的能力,包括文档、网页和其他类型的数据...
4. **性能优化**:讨论了如何提高索引速度和查询效率,包括内存管理、磁盘I/O优化和索引结构的调整。 5. **高级特性**:涵盖了多线程索引、分布式搜索、实时搜索、近实时索引更新以及存储和检索富文档(如PDF或图片...
《Lucene in Action 2nd Edition》是关于Apache Lucene搜索引擎库的一本权威指南,由Manning出版社出版,于2010年6月推出了MEAP(Manning Early Access Program)新版。这本书深入浅出地介绍了如何利用Lucene进行...
接下来,我们要讨论的是IKAnalyzer。IKAnalyzer是一个基于Java实现的中文分词器,它的设计目标是提供一个灵活、高效的中文处理工具。在提供的文件中,我们看到了`IKAnalyzer3.2.5Stable.jar`和`IKAnalyzer2012_u6....
接下来,我们要讨论`ajax例子`。在这个示例中,用户在前端输入搜索关键字后,Ajax会异步发送请求到服务器,而不是刷新整个页面。服务器端的Lucene处理查询,找到匹配的结果,然后将结果返回给前端。前端接收到数据后...
- **查询优化**:讨论提高查询效率的方法,如缓存机制、查询重写等。 ##### 3. 扩展Lucene - **自定义分析器**:如何根据需求定制自己的分析器。 - **字段类型**:探索不同的字段类型及其适用场景。 - **插件开发**...
6. **优化与性能**:讨论如何优化索引和搜索过程,例如使用倒排索引、分词器选择、缓存策略等。 7. **错误处理与调试**:处理可能出现的问题,如文件读取错误、空指针异常等,并提供调试技巧。 8. **示例代码**:...