lucene之sort

itfafa

浏览: 202710 次

最近访客更多访客>>

my404694047

五音谷

欲穷三千界

maomaohou

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java
搜索引擎

lucene

package cn.zqh.lucene.sort;

import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.NumberTools;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.Filter;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.RangeFilter;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.SortField;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Fragmenter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;

import cn.zqh.lucene.highlight.QueryResult;

/**
zqh
*/
public class TestSort {
String indexPath ="D:\\p\\luceneDemo\\luceneIndex";
Analyzer analyzer = new StandardAnalyzer();

//相关度排序
public QueryResult search(String queryString,int firstResult,int maxResult) throws ParseException, IOException{
        IndexSearcher indexSearcher = null;


        //方法1.在搜索的时候指定Field的相关值        方法2.创建索引时指定Document的相关值 doc.setBoost();
   String[] fields={"name","content"};
   Map<String,Float> boots = new HashMap<String,Float>();
   boots.put("name", 3f);//boots.put("name", 1f);默认
   QueryParser queryParser = new MultiFieldQueryParser(fields,analyzer,boots);
   Query query =queryParser.parse(queryString);

   //2、进行查询
     indexSearcher = new IndexSearcher(indexPath);
   Filter filter = null;
   TopDocs top =indexSearcher.search(query, filter, 10000);

     int recordCount = top.totalHits;
     List<Document> recordList = new ArrayList<Document>();

     //准备高亮
     Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>");
     Scorer scorer = new QueryScorer(query);
     Highlighter hg = new Highlighter(formatter,scorer);
     Fragmenter fragmenter = new SimpleFragmenter(50);
     hg.setTextFragmenter(fragmenter);



     //3取出当前页的数据
     int end = Math.min(firstResult+maxResult,top.totalHits);
     for(int i=firstResult;i< end;i++){
     ScoreDoc scoreDoc =top.scoreDocs[i];
     int docSn =scoreDoc.doc;
     Document doc = indexSearcher.doc(docSn);

     //返回高亮后的结果，如果当前属性值中没有出现关键字，会返回null
     String hc =hg.getBestFragment(analyzer,"content",doc.get("content"));

     if(hc ==null){
        String content =doc.get("content");
        int endIndex = Math.min(50,content.length());
        hc = content.substring(0,50);
     }
     doc.getField("content").setValue(hc);

     recordList.add(doc);
     }
     //返回结果
     return new QueryResult(recordCount,recordList);
     //indexSearcher.close();
}

//自定义排序
public QueryResult search(Query query,int firstResult,int maxResult) throws ParseException, IOException{
        IndexSearcher indexSearcher = null;

     indexSearcher = new IndexSearcher(indexPath);

     //使用过滤器
   Filter filter = new RangeFilter("size", NumberTools.longToString(200), NumberTools.longToString(500), true, true);

   //自定义排序
   Sort sort = new Sort();
   sort.setSort(new SortField("size"));//默认升序
   TopDocs top =indexSearcher.search(query, filter, 10000);

     int recordCount = top.totalHits;
     List<Document> recordList = new ArrayList<Document>();

     //准备高亮
     Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>");
     Scorer scorer = new QueryScorer(query);
     Highlighter hg = new Highlighter(formatter,scorer);
     Fragmenter fragmenter = new SimpleFragmenter(50);
     hg.setTextFragmenter(fragmenter);



     //3取出当前页的数据
     int end = Math.min(firstResult+maxResult,top.totalHits);
     for(int i=firstResult;i< end;i++){
     ScoreDoc scoreDoc =top.scoreDocs[i];
     int docSn =scoreDoc.doc;
     Document doc = indexSearcher.doc(docSn);

     //返回高亮后的结果，如果当前属性值中没有出现关键字，会返回null
     String hc =hg.getBestFragment(analyzer,"content",doc.get("content"));

     if(hc ==null){
        String content =doc.get("content");
        int endIndex = Math.min(50,content.length());
        hc = content.substring(0,50);
     }
     doc.getField("content").setValue(hc);

     recordList.add(doc);
     }
     //返回结果
     return new QueryResult(recordCount,recordList);
     //indexSearcher.close();
}
}

分享到：

Lucene多字段搜索 | Nginx负载均衡

2012-11-16 15:06
浏览 1124
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene之sort

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene之sort

评论

发表评论

相关推荐

java实现动态切换上网IP (ADSL拨号上网) java开发

JAVA字符串处理函数

(转)Lucene打分规则与Similarity模块详解

Compass将lucene、Spring、Hibernate三者结合

Lucene3.0详解

Java Web 用户登陆示例代码

Java对数函数及Java对数运算

Lucene为不同字段指定不同分词器(转)

域名管理与解析原理 — 《Java邮件开发详解》读书笔记

优秀的Java工程师需要掌握的10项技能

Web开发入门不得不看

MVC框架的映射和解耦

JAVA发送EMAIL的例子

SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎

Lucene多字段搜索

Nginx负载均衡

Lucene相关度排序的调整

HashSet重复元素判断

JAVA提高教程(2)-认识Set集合之HashSet

使用solr搭建你的全文检索

最近访客更多访客>>

SSH + Lucene + 分页 + 排序 + 高亮模拟简单新闻网站搜索引擎