Solr 及 lucene 的 query 使用方法初級解說
1. 首先假設我的資料裡fields有:name, subbranch, tel, address 預設的搜尋是name這個欄位, 如果要搜尋的資料剛好就是 name 這個欄位,就不需要指定搜尋欄位名稱.
2. 查詢規則:
如欲查詢特定欄位(非預設欄位),請在查詢詞前加上該欄位名稱加 “:” (不包含”號) 符號,
例如: address:台北台北市中正區重慶南路一段xxx號 tel:23xxxxx1
1. q代表query input
2. version代表solr版本(建議不要變動此變數)
3. start代表顯示結果從哪一筆結果資料開始,預設為0代表第一筆, rows是說要顯示幾筆資料,預設為10筆
(因為有時查詢結果可能有幾百筆,但不需要顯示所有結果,所以預設是從第一筆開始到第十筆)
所以若要顯示第10到30筆就改為:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:台北 台北市中正區重慶南路一段xxx號+tel:23xxxxx1&version=2.2&start=10&rows= 20&indent=on
4. indent代表輸出的xml要不要縮行.預設為開啟 on
5. 另外,要限定輸出結果的內容可用 “fl=” 加上你要的欄位名稱,如以下這個範例:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:總統府+ OR+text:郵局&start=0&rows=10&fl=name,subbranch,tel
在fl=之後加上了name,subbranch,tel
所以結果會如下:
<result name=”response” numFound=”1340″ start=”0″>
<doc>
<str name=”name”>總統府郵局</str>
<str name=”subbranch”>台北15支</str>
<str name=”tel”>23xxxxxx9</str>
</doc>
<doc>
<str name=”name”>總統府</str>
<str name=”subbranch”/>
<str name=”tel”>23xxxxxx1</str>
</doc>
</result>
3. 查詢 name 或 subbranch:直接輸入查詢詞, 如: 7-eleven 忠孝店
送出的內容即為:
name:7-eleven AND subbrahch:忠孝店
4. 若要搜尋聯集結果,請在詞與詞間空格或加上大寫 “OR” (不包含”號).
例如: text:總統府 OR text:郵局
text:總統府 OR 郵局
或
總統府 郵局
或
name:總統府 OR tel:23xxxxxx3
或
name:總統府 tel:23xxxxxx3
5. 若要搜尋交集結果,請在詞與詞間加上大寫 “AND” 或 “+” (不包含”號).
例如: text:總統府 AND text:郵局
或
+text:總統府 +text:郵局
或
name:總統府 AND tel:23xxxxxx3
或
name: ( +總統府 +郵局)
6. 排除查詢
在要排除的詞前加上 “-” (不包含”號) 號
例如: 總統府 -郵局
搜尋結果不會有包含郵局的詞的結果在內
7. Group 搜尋
使用 “()” 來包含一個group
如希望搜尋在店名欄位內同時有 “台北”(不包含”號) 及 “火車站”(不包含”號)
8. 增加權重: 如要搜尋 “中華 加油站”(不包含”號) 但因為回傳太多筆資料內有 “中華”(不包含”號) 或 “加油站”(不包含”號) 的結果,
所以想要把有包含 “加油站”(不包含”號)的資料往前排,可使用 “^”(不包含”號)符號在後面加上愈增加的權重數,
像是 “2″,則可以這樣做:
中華 加油站^2
會同時搜尋含有中華或加油站的結果,並把加油站這個詞加權所以搜尋時會先判斷加油站這一個詞在
搜尋結果中的比重,甚至假設一筆資料內加油站出現過兩次以上的就更加會有優先權.
查詢時在查詢詞後加上 “^” (不包含”號) 再加上權重分數
例如: 總統府 AND “郵局”^2
或
總統府^2 OR 郵局
9. Wildcard 搜尋使用 “*” 符號; 如果輸入 “中國*銀” (不包含”號), 結果會有中國信託商業銀行, 中國輸出入銀行圖書閱覽室, 中國商銀證券
中國及銀之間可夾任何長短字詞.
10. 當然還有一些更深入的用法,這裡只是初級的解說,若有興趣可以看看 lucene 或 solr的 document.
转自一台湾网友的blog,现已打不开,这是google的网页快照上的内容。
分享到:
相关推荐
Solr是一种基于Apache Lucene的开源搜索引擎,提供了丰富的查询语法来满足各种搜索需求。在了解Solr查询语法前,我们首先需要了解几个核心概念。 首先,Solr的查询解析是通过queryParser来配置的,通常使用默认配置...
### Solr查询语法详解 #### 一、Core Query Param 查询参数 在Solr查询中,有许多重要的查询参数,这些参数可以帮助我们更精确地控制搜索行为。 1. **q**: 必填参数,代表查询字符串。它是任何Solr查询的基础,...
以上是针对基于Solr的多表join查询加速的一些常见策略和可能涉及的技术点。实际应用中,需要结合业务需求和系统资源进行选择和调整,以达到最佳的性能效果。由于没有具体的博文内容,上述分析是根据标题和标签进行的...
1. **查询语法**:Solr支持丰富的查询语法,包括标准查询解析器(Standard Query Parser)和Lucene查询语法。例如,`q=field:query`用于指定字段查询,`q=*:*`表示匹配所有文档。 2. **查询解析**:查询字符串会被...
4. 高级搜索功能:Solr提供丰富的查询语法,如布尔逻辑、短语匹配、模糊匹配、字段限制等,以及自定义查询解析器和过滤器。 5. 自定义排序和评分:用户可以自定义文档排序规则和评分算法,以满足特定的业务需求。 6....
- **性能优化**:Solr团队不断努力提升查询速度和索引效率,8.11.1版本可能包含了一些新的性能优化。 - **新功能**:可能引入了新的搜索特性,比如新的查询语法、更强大的分析器或者对最新技术标准的支持。 - **稳定...
solr技术分析及运用超详细教程solr开发指南,包括solr服务器搭建,新增数据库配置,配置增量更新,配置分词器,常见异常,删除默认字段,调试技巧,solr日志,,solr基本查询语法,solr多字段匹配,solri集成solr...
- **Query**:Solr支持丰富的查询语法,包括Lucene查询语法、Solr查询API等。 8. **SolrCloud模式**:如果项目涉及到SolrCloud,那么还需要了解分布式搜索和存储的概念,如Sharding(分片)、Replication(复制)...
默认情况下,Solr使用标准查询分析器(Standard Query Parser),但有时我们可能需要针对特定字段定制查询行为,例如,处理特殊查询语法或执行精确匹配。这就是`match-query-parser`发挥作用的地方。 `match-query-...
Solr不仅提供了比Lucene更高级的查询语法,还具有高度可配置和可扩展性,优化了索引和搜索性能。Solr能够独立运行,常被部署在Jetty或Tomcat等Servlet容器中。索引构建是通过HTTP POST方法将XML文档发送到Solr服务器...
查询时,Solr支持多种查询语法和过滤器,可以进行复杂查询和排序。 3. **配置与部署**:Solr的配置文件位于`conf`目录下,包括schema.xml(定义字段和字段类型)、solrconfig.xml(配置索引和查询参数)等。用户...
4.10.3版本支持多种类型的字段,如文本、数字、日期等,并提供了丰富的查询语法,包括标准查询解析器、短语查询、近似查询等。 3. **XML/JSON数据输入**:Solr-4.10.3支持通过HTTP接口接收XML或JSON格式的数据,...
3. 查询索引:利用Solr的查询语法构造查询语句,获取匹配的结果集。 4. 更新索引:对已存在的索引进行修改,如增加、删除或更新文档。 5. 删除索引:根据需要删除特定的文档或者整个索引。 6. 处理结果:解析Solr...
- **查询API**:Solr支持多种查询语法,如Lucene查询语法、Solr查询语法等。 2. **Windows上安装Solr 8.6.0** - **解压**:首先,需要将"solr-8.6.0.zip"解压到本地文件夹。 - **启动服务器**:进入解压后的目录...
注意,虽然Solr的SQL支持提供了更直观的查询方式,但它并不完全符合标准SQL语法,某些功能可能受限。例如,它不支持JOIN操作,但提供了丰富的聚合函数和分组功能。 在实际应用中,你还需要考虑性能优化,如使用Solr...