锁定老帖子 主题:Solr研究
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
作者 | 正文 | ||||||||||||||||||||||||||||
发表时间:2012-03-26
一,概述17173搜索是一套对站内各个系统的信息组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统,因为遇到性能问题,故对基于Lucene的搜索框架Solr进行研究,看能否找到相应的解决方案。 二,测试说明<!--[if !supportLists]-->1, <!--[endif]-->BBS总共有七千万条数据(40G左右)。 <!--[if !supportLists]-->2, <!--[endif]-->在对BBS论坛进行搜索查询时,查询时间久,每次搜索都占用较大的CPU与内存,性能比较低。 <!--[if !supportLists]-->3, <!--[endif]-->综之前研究,因业务需求,改为单字切分,使倒排链表算法在搜索时,浪费很多性能。 <!--[if !supportLists]-->4, <!--[endif]-->在对过时间进行过滤查询时,查询时间缓慢。
因上述原因,故对Solr进行测试,是否在单字切分时,能否解决这一类型的问题,以便引用 三,性能测试内容测试分析
<!--[if !supportLists]-->1, <!--[endif]-->在对BBS进行测试一千万条时,查询时间较快,不会发生性能问题,故产生思路对七千万条数据进行切分成六个索引,进行搜索。
<!--[if !supportLists]-->2, <!--[endif]-->Solr中提供了切分索引的分布式搜索,对其性能进行测试,如图: http://dl.iteye.com/upload/attachment/0065/4607/20a4d05f-3799-314b-ae98-2ae6603b85be.gif 测试结论<!--[if !supportLists]-->1, <!--[endif]-->搭建三台(solr1,solr2,solr3)服务器,solr1用于对其他两台solr2,solr3进行分发请求及计算。 <!--[if !supportLists]-->2, <!--[endif]-->在发出请求时,查询单字切分的两千万条数据时,使用时间过滤时,查询性能也比较慢。 <!--[if !supportLists]-->3, <!--[endif]-->查看其源码实现方式,solr1会第一次发出请求到solr2,solr3中获取符合条件的文档数,并返回其id与相应的得分数。第二次根据得分数向各服务器发出请求,得到得分较高的文档数后返回,请求查询数为(2*n+1),使性能更低于我们本身的17173站内搜索。
查询性能(17173,solr)比较:
<!--[if supportFields]><span lang=EN-US><span style='mso-element:field-begin'></span><span style='mso-spacerun:yes'> </span>SEQ Table \* ARABIC <span style='mso-element: field-separator'></span></span><![endif]-->1<!--[if supportFields]><span lang=EN-US style='mso-no-proof:yes'><span style='mso-element:field-end'></span></span><![endif]-->
故这种查询分发,对于我们这种类型的查询并没有相应的性能提高。 四,遗留问题分析Solr还提供了复制模式,用于满足高并发时架构集群,高并发时分发到不同的服务器,达到负载均衡。但是这并不符合,我们少数请求时引起的性能问题。
可对于在用户搜索时,对搜索字进行切分,没有语义的予以去掉,来提高一部分性能。 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|||||||||||||||||||||||||||||
返回顶楼 | |||||||||||||||||||||||||||||
发表时间:2012-03-27
就是说solr木有17173的效率呗
|
|||||||||||||||||||||||||||||
返回顶楼 | |||||||||||||||||||||||||||||
发表时间:2012-03-27
楼主能否和elasticsearch比较一下,给个测试报告
|
|||||||||||||||||||||||||||||
返回顶楼 | |||||||||||||||||||||||||||||
浏览 4825 次