lucene-使用特定方式分析一个域 - 深未来(深度创造未来)[deepfuture@yeah.net] - ITeye博客

`

deepfuture

浏览: 4437499 次
性别:
来自: 湛江

最近访客更多访客>>

linxl2011

mars36

jccz_zys

zkm0309

博主相关

博客

微博

相册

收藏

留言

关于我

博客专栏

: SQLite源码剖析
浏览量：80446

: WIN32汇编语言学习应用...
浏览量：71019

: 神奇的perl
浏览量：104314

: lucene等搜索引擎解析...
浏览量：287977

: 深入lucene3.5源码...
浏览量：15204

: VB.NET并行与分布式编...
浏览量：68621

: silverlight 5...
浏览量：32690

: 算法下午茶系列
浏览量：46371

文章分类

社区版块

存档分类

最新评论

yoyo837： counters15 写道目前只支持IE吗？插件的东西是跨浏览 ...
Silverlight 5 轻松开启绚丽的网页3D世界
shuiyunbing：直接在前台导出方式：excel中的单元格样式怎么处理，比如某行 ...
Flex导出Excel
di1984HIT：写的很好~
lucene入门-索引网页
rjguanwen：在win7 64位操作系统下，pygtk的Entry无法输入怎 ...
pygtk-entry
ldl_xz： http://www.9958.pw/post/php_exc ...
PHPExcel常用方法汇总(转载)

lucene-使用特定方式分析一个域

博客分类：

搜索引擎

阅读更多

可以通过PerFieldAnalyzerWrapper增加一个自定义的分析器用于特定域的分析

public void testPerFieldAnalyzer() throws Exception{

PerFieldAnalyzerWrapper analyzer=newPerFieldAnalyzerWrapper(new SimpleAnalyzer());

Queryquery=QueryParser.parse("partnum:Q36 ANDSPACE","description",analyzer);

Hitshits=seacher.search(query);

}

分享到：

lucene-处理关键词域 | lucene-近音词查询

2009-12-24 19:57
浏览 1528
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

lucene3源码分析: Lucene的索引过程是一个复杂而有序的操作流程，主要步骤如下： - **1. 创建IndexWriter对象**：初始化索引写入器。 - **2. 创建文档Document对象，并加入域(Field)**：定义文档结构和内容。 - **3. 将文档加入...

Lucene 3.0 原理与代码分析完整版: Lucene是Apache软件基金会的开源项目，它为Java开发者提供了一个高性能、全文检索的工具包，广泛应用于各种信息检索系统。这本书详细介绍了Lucene的核心原理和内部实现机制，并通过代码分析帮助读者更好地理解和应用...

lucene的使用: 首先，通过查询找到需要修改的旧文档并删除，然后创建一个新的Document对象，添加新的域信息，并以同样的方法写入索引库。六、其他Lucene索引域类参数说明： - StringField：用于索引但不分析的字符串域，例如订单...

lucene笔记: Lucene不仅仅是一个简单的搜索工具，而是一个完整的搜索引擎开发平台，它提供了构建复杂搜索应用所需的各种组件。 **1.2 全文检索的应用场景** - **搜索引擎**: 如谷歌、百度等全球性的搜索引擎。 - **站内搜索**:...

Lucene 原理与代码分析完整版: Lucene是一个开源的全文检索库，它的架构设计非常灵活且可扩展。主要组件包括： - **Indexer**：负责创建和维护索引。 - **Searcher**：用于执行搜索并返回结果。 - **Analyzer**：提供分词和语言处理功能。 - **...

Lucene 3.6 学习笔记: Lucene 是一个高性能、全文本搜索库，广泛应用于各种搜索引擎的开发。本文将深入探讨Lucene 3.6版本中的关键概念、功能以及实现方法。 ### 第一章 Lucene 基础 #### 1.1 索引部分的核心类 - `Directory`: 用于存储...

Lucene 原理与代码分析完整版.pdf: 全文检索的核心在于建立和维护一个高效的索引，通过对文档内容的分析和索引化处理，使得后续的查询操作变得简单快速。 ##### 2. 索引里面究竟存些什么索引是全文检索系统的心脏，其存储的内容主要包括文档ID、词语...

Lucene3.0之结果排序: - **基本假设**：如果一个网页被多个其他网页链接，特别是被高权重网页链接，那么该网页本身也具有较高的重要性。 - **计算公式**：PageRank值通过迭代计算得出，公式如下： \[ PR(p_j) = \frac{1-d}{N} + d \sum_...

lucene搜索引擎教程: Lucene是一个开源的全文检索库，主要用Java开发，适用于构建全文检索功能的应用。它并非一个现成的搜索引擎产品，而是一个框架，开发者可以根据自己的需求进行定制，实现类似百度或Google Desktop的功能。Lucene的...

Lucene应用中Pdf文档文本数据提取方法研究: 对于Pdf文档的文本数据提取，研究采用的是xpdf工具包，这是一个广泛认可且高效的Pdf文本提取工具。通过xpdf，可以从Pdf文件中准确地抽取文本内容，使其能够被Lucene索引和检索。具体步骤如下： 1. **下载并安装xpdf...

开放源代码的全文检索引擎Lucene.pdf: 系统结构上，Lucene由索引引擎、查询引擎、文本分析引擎和对外接口等核心组件构成，外加各种应用系统，形成一个完整的服务框架。 ##### 2.2 数据流分析 Lucene的数据流涉及文档输入、索引创建、查询处理和结果返回...

本人的Lucene2.9学习笔记: 3. 域（Field）：文档由多个域构成，每个域代表一个特定的信息，如文件名、内容等。 4. 词（Term）：域内的数据经过分词器（Analyzer）处理，转化为一个个独立的词，这些词是搜索的基本单位。四、Lucene模块详解 1...

lucene 全文检索: 2. **文档域**：在Lucene中，每个要被检索的文件被视为一个文档（Document），文档由多个字段（Field）组成，如标题、正文、作者等。每个字段可以有不同的分析策略。 3. **分词器（Tokenizer）**：分词器是将文本...

【分享：lucene学习资料】---<下载不扣分，回帖加1分，欢迎下载，童叟无欺>: 5.3.3. 按照一个Field来排序 15 5.3.4. 按照多个Field来排序 15 5.3.5. 改变SortField中的Locale信息 15 6. 过滤器 16 7. 分析器Analysis 16 7.1. 自带分析器和过滤器 16 7.2. 第三方过分析器 17 7.2.1. JE分词用法 ...

Lucene+原理与代码: **全文检索**是一种能够对文本中的每一个词（或短语）建立索引，并通过这些索引快速找到包含特定词（或短语）的文档的技术。全文检索系统通常包括两个主要部分：**索引构建**和**查询处理**。 ##### 索引里面究竟存...

lucene学习全方面剖析总结: 本文通过对 Lucene 的各个方面进行了全面剖析，不仅涵盖了 Lucene 的基本原理和技术细节，还介绍了如何利用 Lucene 开发一个完整的搜索引擎系统。通过学习本文，读者不仅可以掌握 Lucene 的基础知识，还能了解到如何...

Global site tag (gtag.js) - Google Analytics