lucene 4.7 （2）全文检索之查询

kettas

浏览: 156836 次
性别:
来自: 贵州

最近访客更多访客>>

zhouhuabin

zgdkik

xubukang

caplike

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

package org.apache.lucene.demo;

/*
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

import java.io.IOException;
import java.io.StringReader;
import java.util.Date;

import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.BooleanClause;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.QueryFilter;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.SortField;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

import thtf.ebuilder.website.search.DBIndex;

/** Simple command-line based search demo. */
public class SearchFiles {

  private SearchFiles() {}

  /** Simple command-line based search demo. */
  public static void main(String[] args) throws Exception {

    String field = "INFO_CONTENT";
    String word = "舞蹈";
    int hitsPerPage = 10;
    
    IndexReader reader = DirectoryReader.open(FSDirectory.open(DBIndex._$.getIndexFile()));
    IndexSearcher searcher = new IndexSearcher(reader);
    QueryParser parser = new QueryParser(Version.LUCENE_47, field, DBIndex._$.analyzer);
      
      Query query = parser.parse(word);
      System.out.println("Searching for: " + query.toString(field));
            
      //排序
      Sort sort=new Sort(new SortField[]{new SortField("info_id", SortField.Type.INT, true)});
      //过滤
      BooleanQuery bqf = new BooleanQuery();
      bqf.add(query,BooleanClause.Occur.SHOULD);
       
      
        Date start = new Date();
       TopDocs tDocs=searcher.search(query,new QueryFilter(bqf),100,sort);
       System.out.println("查询到："+tDocs.scoreDocs.length);
        Date end = new Date();
        System.out.println("Time: "+(end.getTime()-start.getTime())+"ms");

      doPagingSearch(word, searcher, query, hitsPerPage);
    reader.close();
  }

  /**
   * This demonstrates a typical paging search scenario, where the search engine presents 
   * pages of size n to the user. The user can then go to the next page if interested in
   * the next hits.
   * 
   * When the query is executed for the first time, then only enough results are collected
   * to fill 5 result pages. If the user wants to page beyond this limit, then the query
   * is executed another time and all hits are collected.
   * 
   */
  public static void doPagingSearch(String word,IndexSearcher searcher, Query query, 
                                     int hitsPerPage) throws IOException {
 
    // Collect enough docs to show 5 pages
    TopDocs results = searcher.search(query, 5 * hitsPerPage);
    ScoreDoc[] hits = results.scoreDocs;
    
    int numTotalHits = results.totalHits;
    System.out.println(numTotalHits + " total matching documents");

    int start = 0;
    int end = Math.min(numTotalHits, hitsPerPage);
      end = Math.min(hits.length, start + hitsPerPage);
      System.out.println(start+"-"+end);
      for (int i = start; i < end; i++) {
        Document doc = searcher.doc(hits[i].doc);
        SimpleHTMLFormatter formatter=new SimpleHTMLFormatter("<b><font color='red'>","</font></b>");
        Highlighter highlighter=new Highlighter(formatter, new QueryScorer(query));
        highlighter.setTextFragmenter(new SimpleFragmenter(400));
        String content=doc.get("info_title");
        if(content!=null){
          TokenStream tokenstream=DBIndex._$.analyzer.tokenStream(word, new StringReader(content));
          try {
            content=highlighter.getBestFragment(tokenstream, content);
          } catch (InvalidTokenOffsetsException e) {
            e.printStackTrace();
          }
          System.out.println(doc.get("info_id")+"\t"+content);
        }
      }
  }
}

lucene4.7-demo0.zip (4.8 KB)
下载次数: 3

分享到：

2014-06-21 15:42
浏览 702
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

COMSOL激光增材制造技术：热流力三场耦合模型的构建与模拟研究,COMSOL激光增材制造中热-流-力三场耦合模型的研究与应用：基于固体传热、固体力学、层流和动网格技术的多物理场分析,comsol激光: COMSOL激光增材制造技术：热流力三场耦合模型的构建与模拟研究,COMSOL激光增材制造中热-流-力三场耦合模型的研究与应用：基于固体传热、固体力学、层流和动网格技术的多物理场分析,comsol激光增材制造热-流-力三场偶合模型选用固体传热，固体力学，层流和动网格，考虑热物性以及马兰戈尼效应、表面张力，相变潜热，热对流和热辐射等【软件工具】COMSOL5.6 【备注】，comsol三维模型 ,核心关键词：comsol; 激光增材制造; 热-流-力三场偶合模型; 固体传热; 固体力学; 层流; 动网格; 热物性; 马兰戈尼效应; 表面张力; 相变潜热; 热对流; 热辐射; COMSOL5.6; 三维模型。,COMSOL 5.6激光增材制造三场耦合模型

基于PLL的SMO滑模观测器算法在永磁同步电机无传感器矢量控制中的应用及其与反正切SMO的对比：有效消除转速抖动,基于PLL的SMO滑模观测器算法在永磁同步电机无传感器矢量控制中的应用及其与反正切SM: 基于PLL的SMO滑模观测器算法在永磁同步电机无传感器矢量控制中的应用及其与反正切SMO的对比：有效消除转速抖动,基于PLL的SMO滑模观测器算法在永磁同步电机无传感器矢量控制中的应用及其与反正切SMO的对比：有效消除转速抖动,基于PLL的SMO滑模观测器算法，永磁同步电机无传感器矢量控制，跟基于反正切的SMO做对比，可以有效消除转速的抖动。 ,基于PLL的SMO滑模观测器算法; 永磁同步电机无传感器矢量控制; 反正切SMO; 转速抖动消除。,基于PLL SMO滑模观测器：永磁同步电机无传感器矢量控制新算法，优化抖动消除效能

【毕业设计】java-springboot+vue个人云盘管理系统实现源码（完整前后端+mysql+说明文档+LunW）.zip: 【毕业设计】java-springboot+vue个人云盘管理系统实现源码（完整前后端+mysql+说明文档+LunW）.zip

【语音识别】基于matlab自适应滤波器LMS算法鸟类物种识别【含Matlab源码 9977期】.mp4: 海神之光上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

【毕业设计】java-springboot-vue电影推荐系统实现源码（完整前后端-mysql-说明文档-LunW）.zip: 【毕业设计】java-springboot-vue电影推荐系统实现源码（完整前后端-mysql-说明文档-LunW）.zip

基于OpenCV和Python的实时口罩识别系统：支持摄像头与图片检测，界面简洁操作便捷,基于OpenCV的口罩识别系统相关技.: 基于OpenCV和Python的实时口罩识别系统：支持摄像头与图片检测，界面简洁操作便捷,基于OpenCV的口罩识别系统相关技术：python，opencv，pyqt （请自行安装向日葵远程软件，以便提供远程帮助）软件说明：读取用户设备的摄像头，可实时检测画面中的人的口罩佩戴情况，并给予提示。有基础的同学，可稍作修改，检测图片。第一张为运行主界面。第二张为部分代码截图。第三和第四张为运行界面。 ,基于OpenCV的口罩识别系统; Python; OpenCV; PyQt; 远程协助; 摄像头读取; 实时检测; 口罩佩戴情况提示; 代码截图; 运行界面。,"基于OpenCV与Python的口罩识别系统：实时检测与提醒"

Git与GitHub入门指南：版本控制、协作开发及基础命令教程: 内容概要：本文是一份关于 Git 和 GitHub 的入门指南，详细介绍了一整套从安装到进阶使用的完整流程。文章首先阐述了版本控制的重要性，并解释了 Git 的特点和优势。接着逐步介绍了 Git 和 GitHub 的使用方法，包括安装设置 Git、创建和管理 GitHub 账户、创建和克隆仓库，以及日常操作如提交、推送、拉取、分支管理和处理冲突的具体指令和操作步骤。还涉及到高级主题如合并请求、持续集成等功能的介绍，帮助读者深入了解 Git 和 GitHub 的应用范围和最佳实践。适用人群：适用于刚开始接触版本控制系统的初学者，特别是那些正在寻找 Git 和 GitHub 实际操作指导的学生和技术爱好者。使用场景及目标：①为刚踏入软件开发领域的新人提供详尽的基础教学，使其能够快速理解和掌握必要的技能；②指导已有一定经验但仍想进一步深化理解的开发人员如何优化日常工作流程；③促进团队合作效率提升，通过具体的实例演示如何利用版本控制系统协调多人协作。其他说明：随着 Git 和 GitHub 成为现代软件开发的标准工具之一，这份资料不仅涵盖了关键知识点，而且配有多图例解析和实操练习，确保每个阶段的学习都能得到良好反馈和支持。读者可以通过动手实践来巩固所学知识，在实践中遇到困难也能及时参考本文获得解决方案。

python安装-16. 使用指定序列和数值创建一个字典-分配伴侣.py: python安装-16. 使用指定序列和数值创建一个字典——分配伴侣.py

Python+OpenCV魔方识别系: 本研究的目的是基于Python和OpenCV开发一个魔方识别系统，并提供相应的源码和部署教程。通过该系统，用户可以将魔方的图像输入，系统可以自动识别魔方的状态，并给出相应的还原方案。具体来说，本研究的主要内容包括以下几个方面：图像预处理：通过使用OpenCV提供的图像处理算法，对输入的魔方图像进行预处理，包括图像去噪、边缘检测、图像分割等操作，以提高后续的识别准确率。特征提取与模式识别：通过使用OpenCV提供的特征提取算法，对预处理后的图像进行特征提取，以获取魔方的状态信息。然后，通过机器学习算法，对提取到的特征进行模式识别，以确定魔方的状态。还原方案生成：根据识别到的魔方状态，使用经典的还原算法，生成相应的还原方案。通过该方案，用户可以轻松地还原魔方，提高解决效率。

基于Springboot与Vue.js的WMS仓库管理系统源码详解：前后端分离架构下的Java实践与功能详述,基于Springboot和Vue的前后端分离WMS仓库管理系统源码，详细功能参考详情 ,S: 基于Springboot与Vue.js的WMS仓库管理系统源码详解：前后端分离架构下的Java实践与功能详述,基于Springboot和Vue的前后端分离WMS仓库管理系统源码，详细功能参考详情。,Springboot vue仓库管理系统源码Java 前后端分离 WMS仓库管理 BS 功能见详情 ,Springboot; Vue; 仓库管理系统; 源码; Java; 前后端分离; WMS仓库管理; BS; 功能详情,Springboot+Vue仓库管理系统源码：前后端分离的WMS管理BS应用

用AI学安卓游戏开发1-控制小球上下左右移动2代码: 用AI学安卓游戏开发1——控制小球上下左右移动2代码，初始化小球随机自有移动，遇到屏幕边缘反弹，摇杆介入后小球停止自有移动，按照摇杆控制方向移动。

【图像融合】基于matlab拉普拉斯方法水下图像增强融合【含Matlab源码 9983期】复现.mp4: 海神之光上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

【图像加密】基于matlab差分扩展缩略图保持加密【含Matlab源码 9692期】.mp4: 海神之光上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

【图像重建】CT图像重建【含Matlab源码 8035期】.md: CSDN Matlab武动乾坤上传的资料均是完整代码运行出的仿真结果图，可见完整代码亲测可用，适合小白； 1、完整的代码内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主或扫描博客文章底部QQ名片； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

基于ATP-EMTP的110kV海底电缆与架空线雷击过电压仿真分析与研究,基于ATP-EMTP的110kV海底电缆与架空线雷击过电压仿真分析与研究,110kV海底电缆－架空线雷击过电压ATP-EMTP: 基于ATP-EMTP的110kV海底电缆与架空线雷击过电压仿真分析与研究,基于ATP-EMTP的110kV海底电缆与架空线雷击过电压仿真分析与研究,110kV海底电缆－架空线雷击过电压ATP-EMTP仿真分析 ,核心关键词： 110kV海底电缆; 架空线; 雷击过电压; ATP-EMTP仿真分析; 分析。关键词用分号分隔，如上所示。,雷击过电压仿真分析：110kV海底电缆及架空线ATP-EMTP研究

基于800kV高压直流输电的VSC-HVDC仿真模型研究：控制策略与性能分析,基于800kV-VSC-HVDC的直流输电仿真模型研究：深入探讨控制结构与电压稳定性,800kV－VSC－HVDC直流输电: 基于800kV高压直流输电的VSC-HVDC仿真模型研究：控制策略与性能分析,基于800kV-VSC-HVDC的直流输电仿真模型研究：深入探讨控制结构与电压稳定性,800kV－VSC－HVDC直流输电仿真模型（Matlab）流器拓扑：VSC两电平流器电压等级：直流800kV，交流500kV 控制结构：逆变侧定有功控制与电流内环PI＋前馈解耦，整流侧定直流电压与电流内环＋PI前馈解耦；输电距离：100km；双端电压电流均为对称的三相电压电流；直流电压稳定在800kV；双端网侧THD＜2％电子资料， ,800kV; VSC HVDC; 直流输电仿真模型; Matlab; VSC两电平换流器; 直流电压稳定; 逆变侧定有功控制; 电流内环PI+前馈解耦; 整流侧定直流电压与电流内环; 输电距离; 双端电压电流对称; 双端网侧THD＜2％。,Matlab仿真模型：800kV VSC两电平换流器HVDC输电系统

【电池】基于matlab太阳能电池漂移扩散【含Matlab源码 11051期】.mp4: 海神之光上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

【毕业设计】java-springboot-vue电商应用系统实现源码（完整前后端-mysql-说明文档-LunW）.zip: 【毕业设计】java-springboot-vue电商应用系统实现源码（完整前后端-mysql-说明文档-LunW）.zip

【运动学】基于matlab追踪法导弹打飞机仿真【含Matlab源码 11016期】.mp4: 海神之光上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

uniapp使用蓝牙通信示例: uniapp使用蓝牙通信示例

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene 4.7 （2）全文检索之查询

评论

发表评论

相关推荐

最近访客更多访客>>