Searching过程详解

huanglz19871030

浏览: 248660 次
性别:
来自: 深圳

最近访客更多访客>>

leisure0422

skangrui

anttu

beisicao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

搜索引擎(lucene/solr)

1.拦截请求，解析请求并构建相应的handler。

发送检索请求，例如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

首先他将被SolrDispatchFilter拦截。

doFilter(ServletRequest request, ServletResponse response, FilterChain chain)

通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）

将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)

在该方法中主要还是由handler来完成的。

SolrRequestHandler是一个接口，他主要的方法就是：

public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);

SolrRequestHandler的实现类的结构图如下：

其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括

public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){
　　......
　　handleRequestBody( req, rsp );
　　......
}

然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）

例如：这里是做检索，那么就交由SearchHandler处理。

（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程

现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。

if(!rb.isDebug()) {

        // Process

        for( SearchComponent c : components ) {

         <strong> c.process(rb);</strong>

        }

      }

从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：

4.各个SearchComponent配合工作完成检索

我们先重点了解QueryComponent。

获得SolrIndexSearcher，这个对象是检索的主要执行者。

同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

searcher.search(result,cmd);

在SolrIndexSearcher中search方法如下：

public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException {

    <strong>getDocListC(qr,cmd);</strong>

    return qr;

  }

getDocListC又是一个比较复杂的方法，在这里加入的cache。

如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：

private void getDocListNC(QueryResult qr,QueryCommand cmd) 

在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：

super.search(query, luceneFilter, collector);

检索完成将结果进行封装，放入QueryResult当中。

qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));

检索完成后，将结果放入缓存中，“造福后人”！

至此QueryComponent的工作就算完成了。

如果做简单查询（如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on）

那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作

将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------

以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。

searching主要执行方法如下：

SolrDispatchFilter（doFilter,execute）

->SolrCore(execute)

->RequestHandlerBase(handleRequest)

->SearchHandler(handleRequestBody) //有可能执行多个Component

->QueryComponent(process)

->SolrIndexSearcher(search,getDocListC)

转载自：http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html

分享到：

solr学习资料收集 | solr的配置参数理解

2012-07-11 11:41
浏览 1081
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论