`
wb284551926
  • 浏览: 552831 次
文章分类
社区版块
存档分类
最新评论

用solr的facet实现聚合标签(转载)

    博客分类:
  • solr
阅读更多

Facet,单词意思是侧面,平面。哈哈,怎么学英文单词了……

好吧,言归正题,solr的Facet是一个什么东西呢?我个人理解,反映一个搜索词的平面(或者说某一个分组),起到标签聚合统计的功能。举个列子说,像我们公司的电商类网站那样的对搜索结果聚合分类,品牌等属性。如下图

这个是搜索铁观音这个词,统计了分类和品牌2个侧面(分组),铁观音在生活分类下有64个,茗茶里面48……

上面这个说到底,就是某一类型的标签统计,比如xxx年热词等等,只要有记录,也能统计出来,当然,超大数据量提前优化好solr的性能。

介绍了一下facet之后,来说说怎么实现facet。facet的实现其实很简单,主要在搜索参数上带上就OK。

facet=on/true      #代表开启facet
facet.field=cate  #代表要统计的面(分组),比如上面的分类,品牌,可以多次出现
facet.limit =20    #每个分组最多返回条数
facet.mincount = 1 #这个表示分组下某一条目的最数据量
facet.missing = on/true #统计null的值
facet.method =   #默认为fc, fc表示Field Cache
比如:http://localhost/product/select/?q=铁观音&facet=on&facet.field=category&facet.field=brand&facet.mincount=1在搜索结果中返回xml的facet结果

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<lst name="facet_counts">
<lst name="facet_queries"/>
<lst name="facet_fields">
<lst name="category">
<int name="2742">64</int>
<int name="793">48</int>
<int name="2741">12</int>
<int name="801">6</int>
<int name="1087">1</int>
</lst>
<lst name="brand">
<int name="229">74</int>
<int name="227">16</int>
<int name="270">13</int>
<int name="317">10</int>
<int name="0">4</int>
<int name="165">4</int>
<int name="203">3</int>
<int name="147">2</int>
<int name="166">2</int>
<int name="217">1</int>
<int name="342">1</int>
<int name="343">1</int>
</lst>
</lst>

<lst name="category"> 分组名
<int name="2742">64</int> 分组内条目,name表示条目,64是统计结果数。

用solrJ那就更简单了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
ModifiableSolrParams params = new ModifiableSolrParams();
params.set("fq", fq);
params.set("facet", "on");
params.set("facet.field", "category", "brand");
params.set("facet.mincount", "1");
params.set("facet.limit", "15");
params.set("q","铁观音");
QueryResponse qresponse = queryserver.query(params);
FacetField facetField = qresponse.getFacetField(Facet_CATEGORY);
List<Count> counts = null;
if (facetField != null) {
 counts = facetField.getValues();
 if (counts != null) {
 for (Count count : counts) {
 System.out.println(count.getName()+" "+count.getCount());
 }
 }
}

Facet应用很简单,schema上的索引字段都可以作为面统计

 
分享到:
评论

相关推荐

    solr facet 笔记

    Solr 是一个流行的开源搜索引擎,提供了丰富的功能,其中包括 Facet(分面)查询,它能够帮助用户在大量数据中进行高效、多维度的筛选。Facet 查询是数据分析和信息检索中的一个重要工具,允许用户查看数据的不同...

    solrj的facet查询总结

    Facet 查询是 Solr 的高级搜索功能之一,可以给用户提供更友好的搜索体验。在搜索关键字的同时,能够按照 Facet 的字段进行分组并统计。下面是对 SolrJ 的 Facet 查询的总结: 一、Facet 简介 Facet 是 Solr 的...

    快速上手数据挖掘之solr搜索引擎高级教程(Solr集群、KI分词)第15讲 solr之Facet 共7页.pptx

    Solr集群安装与配置(一)第11讲 Solr集群安装与配置(二)第12讲 SolrCloud基本概念第13讲 Solrj操作SolrCloud第14讲 solr索引主从同步第15讲 solr之Facet第16讲 solr之FacetPivot第17讲 solr之Group第18讲 solr之...

    Solr实现电扇站内搜索

    Solr实现电扇站内搜索Solr实现电扇站内搜索Solr实现电扇站内搜索Solr实现电扇站内搜索

    solr实现的搜索引擎

    数据导入到Solr通常有两种方式:使用Solr DataImportHandler (DIH)从关系数据库导入,或使用SolrJ Java客户端API直接推送JSON、XML等格式的数据。在`webapp`目录下的示例可能展示了如何配置DIH来连接数据库并建立...

    solr实现电商自定义打分

    本篇文章将详细介绍如何利用Solr实现电商自定义打分机制。 首先,我们需要了解Solr的评分(Score)机制。Solr的默认评分是基于TF-IDF(词频-逆文档频率)算法的,它会根据查询词在文档中的出现频率和在整个索引中的...

    solr实现京东搜索

    本篇文章将详细阐述如何利用Solr实现京东搜索的功能。 一、关键词搜索 在商品信息搜索中,关键词搜索是最基础也最重要的功能。用户输入关键词后,Solr会通过分析器对关键词进行分词处理,然后在索引库中匹配与之...

    Solr 搜索引擎 asp.net实现 示例详细操作步骤

    我们网站搜索如果数据量大的话,我们使用数据库直接查搜索会很慢,而且由于不能自动分词,结果往往不是很理想,现在我提供了一个例子,内含详细操作步骤和简单增删改查 Solr是一个独立的企业级搜索应用服务器,它...

    CDH使用Solr实现HBase二级索引.docx

    CDH 使用 Solr 实现 HBase 二级索引 在大数据处理中,HBase 是一种流行的 NoSQL 数据库,用于存储大量的数据。然而,在查询和检索数据时,HBase 的性能可能不太理想。这是因为 HBase 是基于 Key-Value 的存储方式,...

    基于Solr的多表join查询加速方法

    Solr,全称为Apache Solr,是一款开源的全文搜索引擎,被广泛应用于企业级搜索解决方案中。它基于Lucene库,提供了高效、...由于没有具体的博文内容,上述分析是根据标题和标签进行的推测,具体实现细节需参考原文档。

    Solr分组统计

    例如,在一个电子商务网站中,你可以使用facet来统计商品按类别、品牌或价格区间分组的数量,这有助于用户快速导航和理解商品的结构。 在使用`easysolr.net`实现facet时,首先需要配置查询参数,指定需要进行分类的...

    Solr权威指南-上卷

    包括部署、配置、Solr Core、Solr DIH、全量导入、增量导入、索引、中文分词、查询组件、Solr Facet、高亮、查询建议,以及企业如何在真实的项目中使用Solr。不仅讲解了基本概念和使用方法,而且还分析了各组件的...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    Solr 数据导入调度器(solr-dataimport-scheduler.jar)是一个专门为Apache Solr 7.x版本设计的组件,用于实现数据的定期索引更新。在理解这个知识点之前,我们需要先了解Solr的基本概念以及数据导入处理...

    使用java实现solr-7.1.0的api和solr最新支持的sql查询

    Solr提供了一个名为SolrJ的客户端库,它允许开发者用Java代码与Solr服务器进行交互。要开始使用SolrJ,你需要在项目中引入相应的依赖,例如在Maven项目中添加以下依赖: ```xml &lt;groupId&gt;org.apache.solr ...

    solr(solr-9.0.0.tgz)

    然后可以通过POST请求将数据导入Solr,Solr会自动进行分词、建立倒排索引等操作,从而实现快速的全文检索。 Lucene是Solr的核心搜索引擎库,它提供了基本的搜索功能,如倒排索引、TF-IDF评分等。而Solr则在其基础上...

    solr的学习

    通过上述内容,我们不仅了解了 Solr 的基本概念、Solr 与 Lucene 的区别,还学习了如何安装和配置 Solr,以及如何使用 Solr 进行索引的创建和搜索。Solr 作为一款企业级的搜索引擎,凭借其强大的功能和灵活性,在...

    Solr(Cloudera)使用手册

    ### Solr(Cloudera)使用手册 #### 一、创建Collection与管理实例 在使用Solr(Cloudera)时,创建Collection是基本的操作之一。Collection是Solr中的数据存储单元,相当于关系数据库中的表。 ##### 创建路径与实例 ...

    Apache Solr(solr-8.11.1.tgz)

    在部署和使用Solr时,了解Solr的生命周期管理、集群配置、备份与恢复策略,以及如何监控和调整性能都是至关重要的。熟悉这些知识点,可以帮助你更好地利用Apache Solr构建高性能的企业级搜索解决方案。

Global site tag (gtag.js) - Google Analytics