`
imjl
  • 浏览: 156537 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

搜索结果排序

阅读更多
利用开源做的搜索结果排序目前主要两种计算方式:索引时做好了score计算和查询时动态计算。各有优缺点,适合不同业务。

搜索结果排序需要考虑的点比较多,比如设定不同字段不同比率来计算score,这些字段的来源是否一致,其包含的信息多大,其如何存储。如果需要动态调整,那么其改动成本多大(人员,硬件,时间,金钱等)?如果多台机器,那么是否需要mapreduce,结果是否cache,cache更新,数据一致性。如果有预处理又该如何做。索引和搜索如何协调一致等。

比较讲究的还需要不断修改搜索结果排序算法来达到准确,快速的目的。

一般搜索满足有搜索关键词显示的,用二分分词就够了,排序用lucene自带的。
特定关键词搜索,比如产品关键词,那么建立产品关键词字典,建立反向索引足够了,速度飞快,很匹配业务。
还不确定的,垂直搜索,随便找个开源分词的,然后设定死与score相关的字段的比率就够了。


好的搜索结果排序不在于一时,而在于不断改进,一如我相信美好的东西是需要反复锻造。
分享到:
评论

相关推荐

    1种基于用户标记的搜索结果排序算法.pdf

    ### 一种基于用户标记的搜索结果排序算法 #### 摘要解读 本文提出了一种新的搜索结果排序算法,旨在解决当前搜索引擎面临的关键问题:如何更准确、更快捷地帮助用户从海量网络信息中筛选出最相关的数据。随着互联网...

    行业文档-设计装置-一种教学资源搜索结果排序的系统及方法.zip

    标题“行业文档-设计装置-一种教学资源搜索结果排序的系统及方法”所指的,是一个专门针对教学资源搜索结果排序的系统及其操作方法的设计。这样的系统能够帮助教师、学生以及教育工作者更有效地找到所需的教学资料,...

    搜索引擎之安全与隐私:匿名化技术在搜索结果排序算法中的应用.docx

    搜索引擎之安全与隐私:匿名化技术在搜索结果排序算法中的应用

    一种改进的综合Borda元搜索引擎结果排序算法

    传统Borda排序算法是根据成员搜索引擎的搜索结果根据位置关系赋予一定的相关分值,但是这种算法对独立的搜索结果排序处理不太好,特别是独立搜索结果较多的情况下。 本文提出的改进算法核心思想是引进检索字符串与...

    网络游戏-网络侧计算机对搜索结果进行排序的数据处理方法.zip

    2. 算法优化:搜索结果排序的核心是排序算法,如快速排序、归并排序或基于评分的排名算法。在网络侧,由于数据量庞大,可能需要采用分布式计算和并行处理的策略,比如MapReduce模型,来提高排序速度。同时,考虑到...

    Google确认将利用+1按钮数据排序搜索结果.docx

    标题中的“Google确认将利用+1按钮数据排序搜索结果”意味着Google打算在其搜索引擎的算法中引入用户通过+1按钮表达的喜好,以此作为影响搜索结果排序的一个因素。这一举措不仅表明Google试图提升搜索质量,同时也...

    基于Lucene的医疗搜索引擎排序算法的研究.rar

    通过用户画像,可以定制个性化的搜索结果排序,提高满意度。 此外,考虑到医疗信息的敏感性,隐私保护不容忽视。在设计排序算法时,必须确保用户数据的安全,遵循相关法律法规,如GDPR等,防止个人信息泄露。 最后...

    Lucene5学习之自定义排序

    首先,Lucene的核心功能之一就是提供高效的全文检索能力,但默认的搜索结果排序通常是基于相关度得分(Relevance Score),这是由TF-IDF算法计算得出的。然而,在实际应用中,我们往往需要根据其他因素(如时间、...

    用友手册资料:ECA-ES企业协同搜索手册.pdf

    * 搜索结果排序:该手册介绍了搜索结果排序的概念和方法,旨在帮助用户更好地排序和管理搜索结果。 主题搜索 * 主题搜索:该手册介绍了主题搜索的概念和方法,旨在帮助用户更好地搜索和管理相关主题的信息。 该...

    搜索引擎排序算法

    该方案利用贝叶斯概率模型来简化计算过程,并通过实验证明了改进后的ARC算法能够更有效地控制主题漂移,从而提高搜索结果的相关性和整体性能。 #### 实验验证与结果分析 为了验证所提改进算法的有效性,研究人员...

    搜索引擎结果的重排序方法.PDF

    搜索引擎结果的重排序方法.PDF 详细介绍了搜索引擎的排序原理和方法。 重排序过程的详细讲解。

    Python-TensorFlow实现的多种排序学习算法

    它广泛应用于搜索引擎的搜索结果排序、电子商务网站的商品推荐等场景。在TensorFlow中,我们可以构建神经网络模型来学习这些排序规则。 这个"tensorflow-LTR-master"压缩包可能包含以下内容: 1. 实现的排序学习...

    Lucene5学习之排序-Sort

    Sort类是Lucene提供的用于控制搜索结果排序的工具。你可以通过创建Sort对象并指定排序规则来定制排序逻辑。排序规则可以是基于字段的,也可以是基于文档的得分。基于字段的排序通常涉及到FieldComparator,它负责...

Global site tag (gtag.js) - Google Analytics