Lucene相关度排序的调整 -

itfafa

浏览: 202708 次

最近访客更多访客>>

my404694047

五音谷

欲穷三千界

maomaohou

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Lucene相关度排序的调整

博客分类：

java
搜索引擎

lucene java

Lucene的搜索结果默认按相关度排序，这个相关度排序是基于内部的Score和DocID，Score又基于关键词的内部评分和做索引时的boost。默认Score高的排前面，如果Score一样，再按索引顺序，先索引的排前面。那么有人问了，如果我要先索引的排后面怎么办呢？隐士研究了源码后发现这是相当简单的事情。以下代码基于Lucene 2.0。

看Sort的默认构造函数，相关度就是SortField.FIELD_SCORE和SortField.FIELD_DOC的组合。

java 代码
/**
* Sorts by computed relevance. This is the same sort criteria as calling
* {@link Searcher#search(Query) Searcher#search()}without a sort criteria,
* only with slightly more overhead.
*/
public Sort() {
this(new SortField[] { SortField.FIELD_SCORE, SortField.FIELD_DOC });
}

那么该如何构造我们需要的SortField呢？请看SortField的一个构造函数，有一个参数reverse可供我们调整结果集的顺序。

java 代码
/** Creates a sort, possibly in reverse, by terms in the given field with the
* type of term values explicitly given.
* @param field Name of field to sort by. Can be <code>null</code> if
* <code>type</code> is SCORE or DOC.
* @param type Type of values in the terms.
* @param reverse True if natural order should be reversed.
*/
public SortField (String field, int type, boolean reverse) {
this.field = (field != null) ? field.intern() : field;
this.type = type;
this.reverse = reverse;
}

由此可见，只要构造一个SortField[]就可以实现我们要的功能，请看：

java 代码
// 评分降序，评分一样时后索引的排前面
new SortField[] { SortField.FIELD_SCORE, new SortField(null, SortField.DOC, true) }

// 评分升序，评分一样时后索引的排前面，呵呵，此为最不相关的排前面，挺有趣的
new SortField[] { new SortField(null, SortField.SCORE, true), new SortField(null, SortField.DOC, true) }

呵呵，只要将此SortField[]作为参数传入Sort的构造函数得到Sort的一个instance，将此instance传入searcher.search(query, sort)即可得到了期望的结果。

来源：中国自学编程网

分享到：

Nginx负载均衡 | HashSet重复元素判断

2012-11-16 11:38
浏览 1749
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene相关度排序的调整

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene相关度排序的调整

评论

发表评论

相关推荐

java实现动态切换上网IP (ADSL拨号上网) java开发

JAVA字符串处理函数

(转)Lucene打分规则与Similarity模块详解

Compass将lucene、Spring、Hibernate三者结合

Lucene3.0详解

Java Web 用户登陆示例代码

Java对数函数及Java对数运算

Lucene为不同字段指定不同分词器(转)

域名管理与解析原理 — 《Java邮件开发详解》读书笔记

优秀的Java工程师需要掌握的10项技能

Web开发入门不得不看

MVC框架的映射和解耦

JAVA发送EMAIL的例子

SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎

Lucene多字段搜索

lucene之sort

Nginx负载均衡

HashSet重复元素判断

JAVA提高教程(2)-认识Set集合之HashSet

使用solr搭建你的全文检索

最近访客更多访客>>

SSH + Lucene + 分页 + 排序 + 高亮模拟简单新闻网站搜索引擎