SimpleFacetsExample -

--晴天--

浏览: 3421 次

最近访客更多访客>>

q133662517

woodding2008

heliangchun_

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

SimpleFacetsExample

博客分类：

Lucene

Lucene java 搜索

/**
* @author wuchangyang
*/
package facet;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.analysis.core.WhitespaceAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.facet.index.FacetFields;
import org.apache.lucene.facet.params.FacetSearchParams;
import org.apache.lucene.facet.search.CountFacetRequest;
import org.apache.lucene.facet.search.DrillDownQuery;
import org.apache.lucene.facet.search.FacetResult;
import org.apache.lucene.facet.search.FacetsCollector;
import org.apache.lucene.facet.taxonomy.CategoryPath;
import org.apache.lucene.facet.taxonomy.TaxonomyReader;
import org.apache.lucene.facet.taxonomy.directory.DirectoryTaxonomyReader;
import org.apache.lucene.facet.taxonomy.directory.DirectoryTaxonomyWriter;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.MatchAllDocsQuery;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;

/**
* @author wuchangyang
* Shows simple usage of faceted indexing and search
*/
public class SimpleFacetsExample {
private final Directory indexDir = new RAMDirectory();
private final Directory taxoDir = new RAMDirectory();
public SimpleFacetsExample(){

}

private void add(IndexWriter writer,FacetFields
    facetFields ,String ... categoryPaths ) throws IOException{
   Document doc=new Document();
   List<CategoryPath> paths=new ArrayList<CategoryPath>();

   for(String categoryPath:categoryPaths){
    paths.add(new CategoryPath(categoryPath));
   }
   facetFields.addFields(doc, paths);
   writer.addDocument(doc);
}
/**
   * Build the example index
   */
private void index()throws IOException{
   IndexWriter indexWriter=new IndexWriter(indexDir,
     new IndexWriterConfig(Version.LUCENE_43,
     new WhitespaceAnalyzer(Version.LUCENE_43)));
   //Writes facet ords to a spearate directory from the main index
   DirectoryTaxonomyWriter taxonomyWriter=new DirectoryTaxonomyWriter(taxoDir);
   //Reuse across documents,to add the necessary facet fields
   FacetFields facetFields=new FacetFields(taxonomyWriter);
   add(indexWriter, facetFields, "Author/Bob", "Publish Date/2010/10/15");
   add(indexWriter, facetFields, "Author/Lisa", "Publish Date/2010/10/20");
   add(indexWriter, facetFields, "Author/Lisa", "Publish Date/2012/1/1");
   add(indexWriter, facetFields, "Author/Susan", "Publish Date/2012/1/7");
   add(indexWriter, facetFields, "Author/Frank", "Publish Date/1999/5/5");
   indexWriter.close();
   taxonomyWriter.close();
}
/** User runs a query and counts facets. */
private List<FacetResult> search() throws IOException {
   DirectoryReader indexReader = DirectoryReader.open(indexDir);
   IndexSearcher searcher = new IndexSearcher(indexReader);
   TaxonomyReader taxoReader = new DirectoryTaxonomyReader(taxoDir);


  // Count both "Publish Date" and "Author" dimensions
   FacetSearchParams fsp = new FacetSearchParams(
      new CountFacetRequest(new CategoryPath("Publish Date"), 5),
      new CountFacetRequest(new CategoryPath("Author"), 5));
   // Aggregatses the facet counts
   FacetsCollector fc = FacetsCollector.create(fsp, searcher.getIndexReader(), taxoReader);
  // MatchAllDocsQuery is for "browsing" (counts facets
  // for all non-deleted docs in the index); normally
  // you'd use a "normal" query, and use MultiCollector to
  // wrap collecting the "normal" hits and also facets:
  searcher.search(new MatchAllDocsQuery(), fc);
   // Retrieve results
  List<FacetResult> facetResults = fc.getFacetResults();

  indexReader.close();
  taxoReader.close();

  return facetResults;
}
/** User drills down on 'Publish Date/2010'. drills down(深化)*/
     private List<FacetResult> drillDown() throws IOException {
    DirectoryReader indexReader = DirectoryReader.open(indexDir);
    IndexSearcher searcher = new IndexSearcher(indexReader);
    TaxonomyReader taxoReader = new DirectoryTaxonomyReader(taxoDir);
    // Now user drills down on Publish Date/2010:
    FacetSearchParams fsp = new FacetSearchParams(
        new CountFacetRequest(new CategoryPath("Author"), 10));
    DrillDownQuery q = new DrillDownQuery(fsp.indexingParams,
        new MatchAllDocsQuery());
    q.add(new CategoryPath("Publish Date/2010/10/15", '/'));
    FacetsCollector fc = FacetsCollector.create(fsp,
        searcher.getIndexReader(), taxoReader);
    searcher.search(q, fc);

    // Retrieve results

    List<FacetResult> facetResults = fc.getFacetResults();
    indexReader.close();
    taxoReader.close();
    return facetResults;
     }
   /** Runs the search example. */
    public List<FacetResult> runSearch() throws IOException {
      index();
      return search();
    }
      /** Runs the drill-down example. */
  public List<FacetResult> runDrillDown() throws IOException {
    index();
    return drillDown();
  }

    /** Runs the search and drill-down examples and prints the results. */
  public static void main(String[] args) throws Exception {
    System.out.println("Facet counting example:");
    System.out.println("-----------------------");
    List<FacetResult> results = new SimpleFacetsExample().runSearch();
    for (FacetResult res : results) {
      System.out.println(res);
    }

    System.out.println("\n");
    System.out.println("Facet drill-down example (Publish Date/2010):");
    System.out.println("---------------------------------------------");
    results = new SimpleFacetsExample().runDrillDown();
    for (FacetResult res : results) {
      System.out.println(res);
    }
  }
}

分享到：

Faceted Search | 为Eclipse添加tomcat8

2014-06-26 08:47
浏览 719
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于改进YOLOv5s的森林烟火检测算法.pdf: 基于改进YOLOv5s的森林烟火检测算法.pdf

人力资源管理工具绩效考核excel模板01.xlsx: 人力资源管理工具绩效考核excel模板01

施工班组长绩效考核表.xls: 施工班组长绩效考核表

57 -营业部经理绩效考核表1.xlsx: 57 -营业部经理绩效考核表1

XX公司行政部绩效考核指标.xls: XX公司行政部绩效考核指标

ant-apache-xalan2-1.9.4-2.el7.x64-86.rpm.tar.gz: 1、文件内容：ant-apache-xalan2-1.9.4-2.el7.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/ant-apache-xalan2-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、安装指导：私信博主，全程指导安装

部门绩效考核表模板（基于KPI以月度为例2）.xlsx: 部门绩效考核表模板（基于KPI以月度为例2）

11-6-质检员绩效考核表（含自动计算、等级评价及任意设置等级）.xlsx: 11-6-质检员绩效考核表（含自动计算、等级评价及任意设置等级）

2024年最新全国河流、湖泊矢量数据(数据权威): 2024最新全国河流湖泊矢量数据【数据介绍】 2024年中国河流湖泊数据一份包含中国境内所有主要河流和湖泊的地理信息数据。数据格式：Shapefile：广泛使用的GIS数据格式，方便在各类GIS软件中使用。数据获取：访问OpenStreetMap官网，通过导出工具选择中国区域并下载所需的数据。使用Geofabrik等第三方网站，可以下载预处理好的中国区域的OSM数据。数据使用：GIS软件：如QGIS、ArcGIS等，用户可以在这些软件中导入OSM数据进行可视化、分析和编辑。数据应用：环境研究：分析河流湖泊的水质变化，研究水资源分布及其环境影响。城市规划：用于规划城市水系、洪水防控、水资源管理等。导航和旅游：为河流湖泊的导航和旅游路线规划提供数据支持。科研：为水文地理研究、生态保护、气候变化等领域提供基础数据。数据特点：实时更新：OSM数据由全球用户贡献，具有较高的实时性和更新频率。开放性：所有数据都在开放许可下发布，允许用户自由使用、修改和分发。详细性：由于全球志愿者的不断努力，数据细节较为丰富，涵盖了从主要河流湖泊到小型水体的广泛范围。数据时间2024年5月，shp格式，数据来源OpenStreetMap。 OpenStreetMap（OSM）介绍：一个开放的、免费的、全球性的地图项目，由全球的志愿者和地图爱好者们共同创建和维护。 OSM的数据包括道路、建筑、公园、河流、湖泊等各类地理信息。由于是由众多志愿者共同编辑，OSM的数据具有很高的实时性和详细程度，特别是在一些活跃的区域，地图数据的更新速度和精度往往超过商业地图服务。用户可以直接在OSM官网下载地图数据，数据格式主要有OSM XML和PBF等。此外，还有一些第三方网站和工具提供更加便捷的数据下载和处理服务，如Geofabrik、Overpass API等。 OSM的数据可以在各种GIS软件中使用，如QGIS、ArcGIS等。此外，还可以使用Python的OSMnx、GeoPandas等库进行编程处理，或者通过Leaflet、Mapbox等JavaScript库将OSM数据集成到web地图应用中。 OSM的所有数据都在开放许可下发布，允许用户自由使用、修改和分发。这使得OSM成为了许多公共项目、研究机构和商业公司的重要数据来源。

部门绩效考核评分表.xlsx: 部门绩效考核评分表

12-11-运输车队长绩效考核表（含自动计算、等级评价）.xlsx: 12-11-运输车队长绩效考核表（含自动计算、等级评价）

ant-javadoc-1.9.4-2.el7.x64-86.rpm.tar.gz: 1、文件内容：ant-javadoc-1.9.4-2.el7.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/ant-javadoc-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、安装指导：私信博主，全程指导安装

springboot整合 freemarker方法: springboot整合 freemarker方法

apache-commons-codec-1.8-7.el7.x64-86.rpm.tar.gz: 1、文件内容：apache-commons-codec-1.8-7.el7.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/apache-commons-codec-1.8-7.el7.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、安装指导：私信博主，全程指导安装

(数据权威)全国旅游抽样调查数据: 《旅游抽样调查资料》是反映入境游客在华（内地）花费和国内居民国内旅游情况的资料性年刊，分为上下两篇。上篇为在华（内地）停留时间在3个月以内的入境游客抽样调查资料，由综合分析报告和调查分类数据两部分组成，分类数据包括：入境游客的主要特征，入境外国人、港澳台同胞的花费水平和花费构成、在境内的停留时间以及入境次数、流向和对住宿单位的选择等。下篇为国内旅游抽样调查资料，汇集了对城镇居民和农村居民的国内旅游抽样调查结果，共分为四个部分：第一部分为综合分析报告；第二部分为国内旅游出游及花费情况；第三部分为城镇居民国内旅游抽样调查分类数据；第四部分为农村居民国内旅游抽样调查分类数据。

二代身份证信息读取（vfp8.0）: 1、表单界面，身份证信息保存在dbf表中，供vfp应用使用，可导出为xls电子表格。 2、提供了身份证过期校验和查询功能。

人事行政主管绩效考核评分表.xls: 人事行政主管绩效考核评分表

08 -大堂副理绩效考核表1.xlsx: 08 -大堂副理绩效考核表1

apr-1.4.8-7.el7.x64-86.rpm.tar.gz: 1、文件内容：apr-1.4.8-7.el7.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/apr-1.4.8-7.el7.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、安装指导：私信博主，全程指导安装

ComponentNameError解决办法.md: ComponentNameError解决办法.md

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SimpleFacetsExample

评论

发表评论

相关推荐

Lucene 自定义距离排序

Faceted Search

关于lucene4.3的benchmark包的介绍

最近访客更多访客>>