- 浏览: 160183 次
- 性别:
- 来自: 北京
最新评论
-
w156445045:
我最近想写这方面的论文,学位论文啊,哎。希望博主能给点思路,谢 ...
《Lucene+Nutch搜索引擎》看过以后。。。 -
inprice:
这也要研究啊!!!!! 失望ing.........
完成了对于heritrix的初步研究 -
dt_fb:
您好,我想问问您,你有跳过recrawl.sh这个脚本文件么? ...
Nutch开源搜索引擎的crawl日志分析及工作目录说明 -
lovepoem:
能增量吗?是不是还是把所有的url遍历出来。和以前的对比。算是 ...
Nutch开源搜索引擎增量索引recrawl的终极解决办法 -
itang:
见到牛人照片了, MS下巴动过刀(开玩笑)
搜索引擎名人堂之Jeff Dean
原文来自:http://liyu2000.nease.net/article/Lucene/queryparsersyntax.htm
Lucene提供了方便您创建自建查询的API,也通过QueryParser提供了强大的查询语言。 本文讲述Lucene的查询语句解析器支持的语法,Lucene的查询语句解析器是使用JavaCC工具生成的词法解析器,它将查询字串解析为Lucene Query对象。 |
|
项( Term ) |
一条搜索语句被拆分为一些项(term)和操作符(operator)。项有两种类型:单独项和短语。 单独项就是一个单独的单词,例如"test" , "hello"。 短语是一组被双引号包围的单词,例如"hello dolly"。 多个项可以用布尔操作符连接起来形成复杂的查询语句(接下来您就会看到)。 注意:Analyzer建立索引时使用的解析器和解析单独项和短语时的解析器相同,因此选择一个不会受查询语句干扰的Analyzer非常重要。 |
|
域( Field ) |
Lucene支持域。您可以指定在某一个域中搜索,或者就使用默认域。域名及默认域是具体索引器实现决定的。 您可以这样搜索域:域名+":"+搜索的项名。 举个例子,假设某一个Lucene索引包含两个域,title和text,text是默认域。如果您想查找标题为"The Right Way"且含有"don't go this way"的文章,您可以输入: title:"The Right Way " AND text:go 或者 title:"Do it right" AND right 因为text是默认域,所以这个域名可以不行。 注意:域名只对紧接于其后的项生效,所以 title:Do it right 只有"Do"属于title域。"it"和"right"仍将在默认域中搜索(这里是text域)。 |
|
项修饰符( Term Modifiers ) |
||||||||||||
Lucene支持项修饰符以支持更宽范围的搜索选项。
|
||||||||||||
|
布尔操作符可将项通过逻辑操作连接起来。Lucene支持AND, "+", OR, NOT 和 "-"这些操作符。(注意:布尔操作符必须全部大写)
|
|||||||||||||||
|
分组( Grouping ) |
Lucene支持使用圆括号来组合字句形成子查询。这对于想控制查询布尔逻辑的人十分有用。 搜索含有"jakarta"或者"apache",同时含有"website"的文档,使用查询: ( jakarta OR apache) AND website 这样就消除了歧义,保证website必须存在,jakarta和apache中之一也存在。 |
|
转义特殊字符( Escaping Special Characters ) |
Lucene支持转义特殊字符,因为特殊字符是查询语法用到的。现在,特殊字符包括 + - && || ! ( ) { } [ ] ^ " ~ * ? : \ 转义特殊字符只需在字符前加上符号\,例如搜索(1+1):2,使用查询 \(1\+1\)\:2 |
评论
不是\(1\+1\)\:2
发表评论
-
Nutch1.0开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇)
2009-09-14 13:15 4342本文主要描述的是如何将paoding分词用plugi ... -
Nutch1.0的那些事
2009-09-10 12:37 2204很久没有更新博客了,应该快一年了。现在呢,我把去年 ... -
配置linux服务器之间ssh不用密码访问
2008-11-05 13:55 3916在配置nutch的时候,我 ... -
搜索引擎术语
2008-10-15 15:30 2553最近monner兄共享了一篇 ... -
搜索引擎机器人研究报告
2008-10-13 15:35 1933从该文对googlebot的分析看,googlebot似乎是想 ... -
搜索引擎算法研究
2008-10-13 15:11 21251.引言 万维网WWW(World Wide Web ... -
谁说搜索引擎只关注结果-看我viewzi的72变
2008-10-04 20:15 1843搜索引擎给大家的感觉,就是用起来简单,以google为首,一个 ... -
《Lucene+Nutch搜索引擎》看过以后。。。
2008-10-03 23:42 7643研究搜索引擎技术快一 ... -
微软有趣的人物关系搜索引擎——人立方
2008-10-03 20:00 3977最近,微软亚洲研究院 ... -
Nutch开源搜索引擎增量索引recrawl的终极解决办法(续)
2008-09-28 19:30 3481十一要放假了,先祝广大同学们节日快乐! 在之前的一篇文章中, ... -
Nutch:一个灵活可扩展的开源web搜索引擎
2008-09-28 11:46 2272在网上找到一篇于2004年11月由CommerceNet La ... -
Google公司都是些什么牛人?
2008-09-27 17:31 2082Google公司都是些什么牛人? 1 Vi ... -
搜索引擎名人堂之Doug Cutting
2008-09-27 11:41 2647Doug Cutting是一个开源搜索技术的提倡者和创造者。他 ... -
Nutch开源搜索引擎增量索引recrawl的终极解决办法
2008-09-26 19:12 5182本文重点是介绍Nutch开源搜索引擎如何在Hadoop分布式计 ... -
Nutch开源搜索引擎与Paoding中文分词用plugin方式集成
2008-09-26 15:31 4598本文是我在集成中文分词paoding时积累的经验,单独成一篇文 ... -
关于Hadoop的MapReduce纯技术点文章
2008-09-24 18:10 3523本文重点讲述Hadoop的整 ... -
MapReduce-免费午餐还没有结束?
2008-09-24 09:57 1489Map Reduce - the Free Lunch is ... -
搜索引擎名人堂之Jeff Dean
2008-09-22 15:09 14983最近一直在研究Nutch,所以关注到了搜索引擎界的一些名人,以 ... -
Lucene于搜索引擎技术(Analysis包详解)
2008-09-22 14:55 2228Analysis 包分析 ... -
Lucene与搜索引擎技术(Document包详解)
2008-09-22 14:54 1725Document 包分析 理解 ...
相关推荐
### Lucene查询语法详解 #### 一、Lucene概述 Lucene是一款高性能、全功能的文本搜索引擎库,被广泛应用于各种需要实现全文检索的应用场景之中。Lucene支持复杂的查询语法,能够灵活地处理多样化的查询需求,使得...
**Lucene查询语法详解** Apache Lucene是一款高性能、全文本搜索库,被广泛应用于各种搜索引擎的构建。在使用Lucene进行信息检索时,理解和掌握其查询语法至关重要。本篇文章将深入探讨Lucene的查询语法,帮助你更...
用到的工具 jsoup+spring+struct+DButil+mysql+lucene 可以配置采集网站的图片,包含分组统计,相同数据合并功能,主要是给群内成员来个demo,让大家有个学习的demo 小试牛刀、临时写的,莫吐槽 需要用到mysql...
**查询语法**是用户用来构造查询请求的语言规范,Lucene 支持丰富的查询语法,如布尔查询、短语查询等。 **JavaCC** 是一个用于生成词法分析器和语法分析器的工具,**QueryParser** 则是 Lucene 提供的一个用于解析...
3. **查询解析**: 用户输入的查询字符串会被转换为Lucene查询语法,QueryParser类负责这个过程。它可以处理各种查询类型,如布尔查询、短语查询、前缀查询等。 4. **文档检索**: 使用IndexReader和IndexSearcher类...
#### Lucene 查询语法 - **语法关键字**:用于构建查询的特殊字符,如 AND、OR、NOT 等。 - **查询词(Term)**:用户查询时输入的基本单位。 - **查询域(Field)**:指定查询作用于文档的哪个字段。 - **通配符查询...
2. **查询解析和语法**: `lucene-queryparser.jar`和`lucene-sandbox.jar`提供了查询解析器,允许用户使用标准的Lucene查询语法来构建复杂的查询表达式。`lucene-suggest.jar`支持自动补全和建议功能。 3. **内存和...
24 Lucene学习总结之八:Lucene的查询语法,JavaCC及QueryParser(1)
3. 查询解析:用户可以使用标准的Lucene查询语法或构造复杂的查询表达式,Lucene.Net会将其解析为可执行的搜索计划。 4. 高效搜索:通过倒排索引,Lucene.Net可以迅速找到包含特定词语的文档,支持多种搜索类型,如...
3. **构造查询**:`QueryParser`用于构建Lucene查询语句,它理解标准的Lucene查询语法。提供一个Analyzer和查询字符串,`QueryParser`将生成一个`Query`对象。 4. **执行查询**:使用`IndexSearcher`的`search()`...
在Lucene中,表达式查询是一种高级查询方式,允许用户通过特定的语法构造复杂的查询条件。本篇文章将深入探讨Lucene表达式处理查询的原理、语法及示例。 ### 1. Lucene表达式查询基础 Lucene表达式查询是基于...
1. **查询语法**:Solr支持丰富的查询语法,包括标准查询解析器(Standard Query Parser)和Lucene查询语法。例如,`q=field:query`用于指定字段查询,`q=*:*`表示匹配所有文档。 2. **查询解析**:查询字符串会被...
lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合
开发人员可以使用自然语言或Lucene查询语法来创建查询,然后通过`Searcher`类执行查询,获取匹配的文档。`TopDocs`对象返回搜索结果,包括文档得分和排名信息。 除此之外,PyLucene还支持高级特性,如分词器...
它支持标准的 Lucene 查询语法,包括布尔运算符(AND、OR、NOT)、字段限定、模糊匹配、短语查询等,使用户可以方便地构造复杂的搜索条件。 在实际应用中,使用这些组件,开发者可以构建一个高效的全文搜索引擎。...
Tripod介绍Tripod用于对文本数据的实时匹配分析,其语法主要兼容了lucene语法,并做了微调。在很多文本处理的应用中,会有类似数据订阅的需求,即将客户关注的数据推送给客户。一种典型的实现是,我们会根据用户...
- **查询API**:Solr支持多种查询语法,如Lucene查询语法、Solr查询语法等。 2. **Windows上安装Solr 8.6.0** - **解压**:首先,需要将"solr-8.6.0.zip"解压到本地文件夹。 - **启动服务器**:进入解压后的目录...
同时,Solr支持多种查询语法,包括标准查询解析器(Standard Query Parser)、Lucene查询语法(LQL)等,以及高级特性如布尔运算、短语匹配、模糊搜索等。 其次,SolrCloud是Solr的分布式部署模式,它基于ZooKeeper...
- 查询分析(Query Parsing):将用户的输入转换为查询语法,可能涉及短语查询、布尔查询等。 - 匹配评分(Scoring):Lucene使用TF-IDF(Term Frequency-Inverse Document Frequency)或其他评分算法,计算每个文档...