以下文章转自http://my.opera.com/jinglepot/blog/solr-lucene-query
solr, Lucene Query 使用方法:
- 检索/查询
因为solr 是用lucene
的引擎,所以它们的query 用法原则上是一样的.
1. 首先假设我的资料里fields有:name,
subbranch, tel, address 预设的搜寻是name这个栏位, 如果要搜寻的资料刚好就是name
这个栏位,就不需要指定搜寻栏位名称.
2. 查询规则:
如欲查询特定栏位(非预设栏位),请在查询词前加上该
栏位名称加":" (不包含"号) 符号,
例如:
address:台北台北市中正区重庆南路一段xxx号tel:23xxxxx1
1. q代表query input
2.
version代表solr版本(建议不要变动此变数)
3.
start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔资料,预设为10笔
(因为有时查询结果可能有几百笔,但不需要显示所有结
果,所以预设是从第一笔开始到第十笔)
所以若要显示第10到30笔就改为:
http://localhost:8080/solr/select/?indent=on&
version=2.2&q=address:台北台北市中正区重庆南路一段xxx号tel:23xxxxx1&
version=2.2&start=10&rows=20&indent=on
4. indent代表输出的xml要不要缩行.预设为开启on
5.
另外,要限定输出结果的内容可用"fl=" 加上你要的栏位名称,如以下这个范例:
http://localhost:8080/solr/select/?indent=on&
version=2.2&q=text:总统府OR text:邮局&start=0&rows=10&
fl=name,subbranch,tel
在fl=之后加上了
name,subbranch,tel
所以结果会如下:
<result name="response" numFound="1340" start="0">
<doc>
<str
name="name">总统府邮局</str>
<str
name="subbranch">台北15支</str>
<str
name="tel">23xxxxxx9</str>
</doc>
<doc>
<str
name="name">总统府</str>
<str
name="subbranch"/>
<str
name="tel">23xxxxxx1</str>
</doc>
</result>
3. 查询name
或subbranch:直接输入查询词, 如: 7-eleven 忠孝店
送出的内容即为:
name:7-eleven AND subbrahch:忠孝店
4. 若要搜寻联集结果,请在词与词间空格或加上大写"OR" (不包含"号).
例
如: text:总统府 OR text:邮局
text:总统府 OR 邮局
或
总统府 邮局
或
name:总统府 OR tel:23xxxxxx3
或
name:总统府 tel:23xxxxxx3
5.
若要搜寻交集结果,请在词与词间加上大写"AND" 或" " (不包含"号).
例如:
text:总统府 AND text:邮局
或
text:总统府 text:邮局
或
name:总统府 AND tel:23xxxxxx3
或
name: ( 总统府 邮局)
6. 排除查询
在要排除的词前加上"-" (不包含"号) 号
例如: 总统府 -邮局
搜寻结果不会有包含邮局的词的结果在内
7. Group 搜寻
使用 "()" 来包含一个group
如希望搜寻在店名栏位内同时有"台北"
(不包含"号) 及"火车站"(不包含"号)
8. 增加权重:
如要搜寻"中华加油站"(不包含"号) 但因为回传太多笔资料内有"中华"(不包含"号) 或"加油站"(不包含"号) 的
结果,
所以想要把有包含"加油站"(不包含"号)的资料往前排,可使用"^"
(不包含"号)符号在后面加上愈增加的权重数,
像是 "2",则可以这样做:
中华 加油站^2
会同时搜寻含有中华或加油站的结果,并把加油站这个
词加权所以搜寻时会先判断加油站这一个词在
搜寻结果中的比重,甚至假设一笔资料内加油站出现过两次以上的就更加会有优先权.
查询时在查询词后加上"^" (不包含"号) 再加上权重分数
例如: 总统府
AND "邮局"^2
或
总统府^2 OR
邮局
9. Wildcard 搜寻使用"*" 符号; 如果输入"中国*银"
(不包含"号), 结果会有中国信托商业银行, 中国输出入银行图书阅览室, 中国商银证券
中国及
银之间可夹任何长短字词.
10. 当然还有一些更深入的用法,这里只是初级的解说,若有兴趣可以看看lucene
或solr的document.
分享到:
相关推荐
当用户发起搜索请求时,Webx3会将请求发送到Solr,Solr接收到请求后,使用Paoding分词库对查询进行处理,然后在索引中查找匹配的文档,最后将结果返回给Webx3,由Webx3将结果显示给用户。 压缩包中的"webx3-paoding...
### Lucene与Solr的使用详解 #### 一、Lucene概述 Lucene是一款高性能、全功能的文本搜索引擎库,由Java语言编写而成。它能够为应用系统提供强大的全文检索能力,是当前最为流行的开源搜索库之一。由于其高度可...
Solr 使用Lucene作为其核心搜索引擎库,提供了一个分布式、可扩展且高度可用的搜索和分析服务。 **Lucene**: Apache Lucene 是一个高性能、全功能的文本搜索库,也是Solr的核心。它提供了强大的索引和搜索功能,...
标题“lucene简单介绍及solr搭建使用”涉及了两个主要的开源搜索技术:Lucene和Solr。Lucene是Java开发的一个全文检索库,而Solr则是基于Lucene构建的企业级搜索平台,提供了更高级的功能和管理界面。 **Lucene简介...
Solr、Elasticsearch和Lucene是三个在搜索引擎领域中至关重要的技术,它们共同构建了现代数据检索的基础架构。下面将分别对这三个组件进行详细解释,并探讨它们之间的关系。 **Lucene** Lucene是一个高性能、全文本...
关于solr和lucene的使用方法,这是传智播客黑马的教学视频
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一...
Solr 依存于Lucene,因为Solr底层的核心技术是使用Lucene 来实现的,Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的...
Apache Solr 和 Lucene 是两个在全文搜索领域广泛使用的开源框架。它们的组合为构建高效、可扩展的搜索引擎提供了强大的工具。以下是对这两个组件及其在搜索模块设计实现中的关键知识点的详细说明: 1. **Apache ...
Solr 是一个基于 Lucene 的开源搜索引擎,提供了一个分布式、可扩展、易用的搜索和分析平台。在本文档中,我们将详细介绍如何部署和使用 Solr 5.5.4 版本,包括两种常见的部署方式:Jetty 和 Tomcat,并涉及到中文...
lucene&solr原理分析,lucene搜索引擎和solr搜索服务器原理分析。
5. Solr是一个基于Lucene构建的企业级搜索服务器,它提供了搜索引擎的索引、搜索、排序等功能,并通过RESTful API与各种客户端进行交互。Solr在实现搜索引擎方面,不仅继承了Lucene的强大功能,还提供了分布式搜索、...
### Solr(Cloudera)使用手册 #### 一、创建Collection与管理实例 在使用Solr(Cloudera)时,创建Collection是基本的操作之一。Collection是Solr中的数据存储单元,相当于关系数据库中的表。 ##### 创建路径与实例 ...
系统在自己一步一步部署下完成站内搜索,可以了解Solr集合SpringMvc的使用,对Solr安装使用可以提升许多,我还有一篇文展描述了步骤, 配置完好的solr(中文分析器)+我配置的SolrHome+mysql的数据库+javaweb程序 希望...
lucene solr 全文搜索框架,该教程有助于深入了解lucene solr的用法以及他么们之间的比较
其设计目标是提供一个可以方便地在Lucene、Solr等项目中快速接入的中文分词组件。IKAnalyzer支持热更新词典,能够动态添加或删除词汇,这在处理新词汇或者特殊领域词汇时非常有用。 集成IKAnalyzer到Lucene 4.5的...
2. 在Solr的核心配置(例如new_core/conf目录下)中,打开schema.xml文件(如果你使用的是Solr 6及以上版本,可能是managed-schema文件),添加IKAnalyzer作为字段类型定义。例如: ```xml ...