利用Boost影响Lucene查询结果的排序

catastiger

浏览: 140180 次
性别:
来自: 杭州

最近访客更多访客>>

lifan51777

lyl867708794

javaskyhome

chenjinjun40422p

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

lucene

lucene C C++C#F#

前提:不对结果做sort操作.
在搜索中,并不是所有的Document和Fields都是平等的.有些技术会要求到对其Doucment或者Fields的权值改变,默认值为:1.0F,以上需求都是通过改变Document的boost因子来改变的. 下面是通过lucene3.0,IKAnalyzer
1.通过设置doc boost改变排序结果

    /**
     * 设置DOC boost 值影响查询排序结果
     * @throws Exception
     */
    public void testBoost1() throws Exception{
        System.out.println("设置DOC boost 值影响查询排序结果");
        RAMDirectory ramDir = new RAMDirectory();
        Analyzer analyzer = new IKAnalyzer();
        IndexWriter iw = new IndexWriter(ramDir, analyzer, true ,IndexWriter.MaxFieldLength.LIMITED);
        
        String[] nameList = { "you are my friend", "a are my wife", "I love you" };
        String[] addList = { "b", "you are my wife", "c" };
        String[] fileList = { "1", "2", "3" };

        for (int i = 0; i < nameList.length; i++){
            Document doc = new Document();
            doc.add(new Field("name", nameList[i], Field.Store.YES, Field.Index.ANALYZED));
            doc.add(new Field("file", fileList[i], Field.Store.YES, Field.Index.ANALYZED));
            doc.add(new Field("address", addList[i], Field.Store.YES, Field.Index.ANALYZED));
            if (i == 2) {
                doc.setBoost(2.0f); 
            }
//            这里设置了第三个文档优先级最高，所以在搜索出来的结果中，该文档排在最前
            iw.addDocument(doc);
        }
        iw.close();

        IndexSearcher _searcher = new IndexSearcher(ramDir);
        String[] fields =new String[]{"name","address"};
        Query query=IKQueryParser.parseMultiField(fields, "you");

        TopDocs topDocs = _searcher.search(query,_searcher.maxDoc());
        ScoreDoc[] hits = topDocs.scoreDocs;
        for (int i = 0; i < hits.length; i++) {
            Document doc = _searcher.doc(hits[i].doc);
            System.out.println("name:"+doc.get("name"));
            System.out.println("file:"+doc.get("file"));
        }
        _searcher.close();
        
    }

if (i == 2) { doc.setBoost(2.0f); }这样I love you 将先输出，
2.通过设置query 影响排序

 /**
     * 设置query boost值影响排序结果,如果有排序sort，则完全按照sort结果进行
     * @throws Exception
     */
    public void testBoost2() throws Exception{
        System.out.println("设置query boost值影响排序结果");
        RAMDirectory ramDir = new RAMDirectory();
        Analyzer analyzer = new IKAnalyzer();
        IndexWriter iw = new IndexWriter(ramDir, analyzer, true ,IndexWriter.MaxFieldLength.LIMITED);
        
        String[] nameList = { "you are my friend", "a are my wife", "I love you" };
        String[] addList = { "b", "you are my wife", "c" };
        String[] fileList = { "1", "2", "3" };

        for (int i = 0; i < nameList.length; i++)
        {
            Document doc = new Document();
            doc.add(new Field("name", nameList[i], Field.Store.YES, Field.Index.ANALYZED));
            doc.add(new Field("file", fileList[i], Field.Store.YES, Field.Index.ANALYZED));
            doc.add(new Field("address", addList[i], Field.Store.YES, Field.Index.ANALYZED));
            iw.addDocument(doc);
        }
        iw.close();
        IndexSearcher _searcher = new IndexSearcher(ramDir);
        
        BooleanQuery bq = new BooleanQuery();
        QueryParser _parser = new QueryParser(Version.LUCENE_30,"name",analyzer);
        Query  _query = _parser.parse("you");
        _query.setBoost(2f);
        
        QueryParser _parser1 = new QueryParser(Version.LUCENE_30,"address",analyzer);
        Query  _query1 = _parser1.parse("you");
        _query1.setBoost(1f);
       
        bq.add(_query, BooleanClause.Occur.SHOULD);
        bq.add(_query1, BooleanClause.Occur.SHOULD);
//       
        
//          for(int i=0;i<2;i++){
//              QueryParser parser = new MultiFieldQueryParser(Version.LUCENE_30,new String[] {"name", "address" }, analyzer);
//              Query q1 = parser.parse("you");
//              bq.add(q1, BooleanClause.Occur.MUST);
//          }
//         
//         SortField[] sortFields = new SortField[1];  
//         SortField sortField = new SortField("file", SortField.INT, true);//false升序，true降序  
//         sortFields[0] = sortField;  
//         Sort sort = new Sort(sortFields);  
//         TopDocs topDocs = _searcher.search(bq,null,_searcher.maxDoc(),sort);
//        
        
        TopDocs topDocs = _searcher.search(bq,_searcher.maxDoc());
        ScoreDoc[] hits = topDocs.scoreDocs;
        for (int i = 0; i < hits.length; i++) {
            Document doc = _searcher.doc(hits[i].doc);
            System.out.println("name:"+doc.get("name"));
            System.out.println("file:"+doc.get("file"));
        }
        _searcher.close();
        
    }

结果如下：（name 的boost最高，所以name优先于address排序在前面）
设置query boost值影响排序结果
name:you are my friend
file:1
name:I love you
file:3
name:a are my wife
file:2

3.通过设置fields 的boost 影响排序

/**
     * 设置field boost 值影响查询排序结果,有排序则按照排序
     * @throws Exception
     */
     //没设置field boost 213 设置后是132
    public void testBoost3() throws Exception{
        System.out.println("设置fields boost 值影响查询排序结果");
        RAMDirectory ramDir = new RAMDirectory();
        Analyzer analyzer = new IKAnalyzer();
        IndexWriter iw = new IndexWriter(ramDir, analyzer, true ,IndexWriter.MaxFieldLength.LIMITED);
        String[] nameList = { "you are my friend", "a are my wife", "I love you" };
        String[] addList = { "b", "you are my wife", "c" };
        String[] fileList = { "1", "2", "3" };

        for (int i = 0; i < nameList.length; i++)
        {
            Document doc = new Document();
            Field nameField =  new Field("name", nameList[i], Field.Store.YES, Field.Index.ANALYZED);
            nameField.setBoost(20f);
            doc.add(nameField);
            doc.add(new Field("file", fileList[i], Field.Store.YES, Field.Index.ANALYZED));
            Field f = new Field("address", addList[i], Field.Store.YES, Field.Index.ANALYZED);
            f.setBoost(30f);
            doc.add(f);
            iw.addDocument(doc);
        }
        iw.close();
        
       
        IndexSearcher _searcher = new IndexSearcher(ramDir);
        String[] fields =new String[]{"name","file","address"};
        Query query=IKQueryParser.parseMultiField(fields, "you");
        
//        SortField[] sortFields = new SortField[1];  
//        SortField sortField = new SortField("file", SortField.INT, true);//false升序，true降序  
//        sortFields[0] = sortField;  
//        Sort sort = new Sort(sortFields);  
//        TopDocs topDocs = _searcher.search(query,null,_searcher.maxDoc(),sort);
        
        TopDocs topDocs = _searcher.search(query,_searcher.maxDoc());
        ScoreDoc[] hits = topDocs.scoreDocs;
        for (int i = 0; i < hits.length; i++) {
            Document doc = _searcher.doc(hits[i].doc);
            System.out.println("name:"+doc.get("name"));
            System.out.println("file:"+doc.get("file"));
        }
        _searcher.close();
        
    }

结果如下：（address 的boost最高，先排在前面了）
设置fields boost 值影响查询排序结果
name:a are my wife
file:2
name:you are my friend
file:1
name:I love you
file:3

分享到：

用MultiSearcher在多索引中进行搜索 | lucene搜索结果排序问题

2010-11-05 14:19
浏览 2771
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论