建立了两个域如:
Field field1 = new Field("ArticleTitle", "北京2008年奥运会", Field.Store.YES,Field.Index.TOKENIZED);
doc1.add(field1);
Field field2 = new Field("ArticleText", "这是一届创造奇迹、超越梦想的奥运会.......",Field.Store.YES, Field.Index.TOKENIZED);
String[] fields = { "ArticleTitle", "ArticleText" };
BooleanClause.Occur[] clauses = { BooleanClause.Occur.MUST,BooleanClause.Occur.SHOULD };
Query query = MultiFieldQueryParser.parse(serchString, fields, clauses, //serchString为传过来的参数,
new StandardAnalyzer());
MultiSearcher searcher = new MultiSearcher(indexSearchers);
现在假设serchString为("北京 奥运会")它把只要有北京的域都找出来了,怎么样把ArticleTitle中有北京,而且ArticleText中有奥运会选出来,
就好像第一次搜索ArticleTitle=北京,第二次在这个结果里再搜索ArticleText=奥运会,这中间是一个and的关系,
把BooleanClause.Occur都改为must也不行,改怎么做啊??谢谢了
相关推荐
nutch二次开发总结.txt nutch入门.pdf nutch入门学习.pdf Nutch全文搜索学习笔记.doc Yahoo的Hadoop教程.doc [硕士论文]_基于Lucene的Web搜索引擎实现.pdf [硕士论文]_基于MapReduce的分布式智能搜索引擎框架研究....
Apache Lucene 7.1.0 发布了,Lucene 是 Apache 软件基金会的一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene 的目的是为软件开发人员...
#### 二、Lucene 2.0 **1. Lucene 的核心功能** - **搜索与排序**:Lucene 提供了高级的搜索功能,包括基于关键字的搜索、排序以及结果过滤等功能。 - **文档处理**:能够处理多种格式的文档,如 Word、Excel 和 ...
本压缩包包含的是Lucene 3.5.0版本的全部源码,对于想要深入理解Lucene工作原理、进行二次开发或者进行搜索引擎相关研究的开发者来说,是一份非常宝贵的学习资源。 Lucene 3.5.0是Lucene的一个重要版本,它在3.x...
通过阅读和分析源码,你可以更深入地理解Lucene的内部机制,这对于解决问题和进行二次开发非常有帮助。 总的来说,Lucene 2.4.1作为一个功能强大的搜索框架,提供了丰富的工具和接口,使得开发者可以专注于构建自己...
1.1分鼓励下。 2.本工具是在windows平台下的文件搜索工具,可以按照指定类型(word,excel,txt...5.索引后就是秒搜,索引带缓存机制,二次索引速度极快。 6.搜索准确度百分百,按空格就可多关键词搜索,并且不限顺序。
这些jar包可能包含自定义的分析器、查询解析器、过滤器等,是开发者根据实际项目需求进行的二次开发成果。 四、“ik的jar包”与分词器 “Ik”的jar包则可能是指“Smart Chinese Analyzer for Lucene”,即ik分词器...
完整的《Lucene+nutch搜索引擎开发》pdf版一共有83.6M,无奈我上传的上限是80M,所以切成两个。这个是副文件,还有个主文件http://download.csdn.net/detail/spring123tt/4361166 ,解压时,将两个文件放在一起解压...
开发者可以通过阅读源码了解其内部实现原理,以便更好地进行二次开发和优化。 3.2 关键类解析 - Document:表示一个待索引的文档,包含多个Field(字段)。 - Field:文档中的一个属性,可以设置是否被索引、是否...
二、引入Lucene依赖 要使用Lucene,我们需要在pom文件中引入相关依赖。这些依赖包括: * lucene-core:Lucene的核心包,提供了基本的索引和搜索功能。 * lucene-queryparser:提供了查询解析的功能,用于将用户...
#### 二、手机之家搜索系统概述 **手机之家简介** - 手机之家成立于2002年,是国内知名的手机产品资讯网站。 - 经过多年发展,积累了大量的用户基础与内容资源。 - 目前已拥有超过1100万注册用户,日均页面浏览量达...
二、Lucene的工作流程 1. 文档分析:Lucene通过Analyzer对输入的文本进行分词,生成Token流。 2. 建立索引:将Token流转化为Term(关键词)和Posting(关键词出现的位置及频率)的结构,存储在磁盘上,形成倒排索引...
【标签】"源码"表明该项目提供了源代码,允许开发者深入理解其内部工作原理,进行定制化开发或二次开发。"工具"标签则意味着这是一个实用的软件工具,用于解决特定问题,即在医院环境中提供强大的搜索能力。 【压缩...
描述中提到的《开发自己的搜索引擎》第二版,是一本可能教导如何利用Lucene创建自定义搜索引擎的书籍。配套的Lucene-jar包是读者在实践中需要用到的资源,这里提供的是2.0.0版本的jar文件。作者保证了这个压缩包的...
- **可扩展性强**:提供了丰富的API接口,便于二次开发和功能扩展。 ##### 1.2 Lucene的工作原理 Lucene主要通过以下步骤实现文档的索引和检索: 1. **文档解析**:将文档转换为一系列可被索引的词条。 2. **建立...
在"lucene-1.4.3.src"中,包含了源代码,开发者可以直接查看和学习Lucene的实现细节,这对于理解其工作原理和进行二次开发非常有价值。而"lucene-1.4.3.zip"则包含了编译后的JAR文件"lucene-1.4.3.jar",这使得...
Lucene内部定义了索引文件的格式,具有独立于应用平台的特点,采用倒排索引结构提高检索速度,并且应用面向对象技术,便于扩展及二次开发。 Lucene的组成结构包括7个子包,每个包完成特定的功能。analysis语言...
本文将深入探讨Lucene 5.3.1版本的核心概念、架构以及如何利用其源代码进行二次开发。 一、Lucene基础 1. Lucene核心组件: - 文档(Document):存储用户数据的容器,可以包含多个字段(Field),如标题、内容等...