`
天堂飘过
  • 浏览: 19673 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

lucene 增加匹配权重

阅读更多
在用 自由侠_jeep 作为关键字搜索时
索引中有2个文档
1 jeep自由侠(进口)

2 jeep自由侠

由于jeep与自由侠出现频率相同 所以两个文档分数相同

于是我针对所有进口车系 增加判断

String sname = s.getZhName();

if (!sname.contains("进口")){
    sname = sname+sname;
}

将jeep自由侠 变为jeep自由侠自由侠

增加2的分数 得到想要的结果
分享到:
评论

相关推荐

    lucene 权重设置

    5. **查询时设置权重(Query Boost)**:在构建查询时,可以使用`query.setBoost(boost)`为特定查询语句增加权重。例如,对于标题和内容分开存储的字段,即使未显式加权,标题的匹配通常也会得到更高的评分,因为...

    lucene搜索引擎项目

    查询执行阶段,Lucene会使用倒排索引快速找到匹配的文档,并根据查询权重对结果进行排序。 4. **优化与更新** Lucene支持增量索引,意味着可以对新的或已更改的数据进行实时更新。索引优化则是一次性合并多个段...

    Lucene示例 BM25相似度计算

    查询解析器将用户输入转化为 Lucene 可以理解的Query对象,然后执行查询,返回匹配的文档集合。在本示例中,我们将看到如何使用这些功能并对比不同的相似度计算方法。 现在我们聚焦于BM25相似度。BM25(Best Match ...

    Lucene中的FST算法描述

    如果一个节点(例如node1)的hash值与HashMap中的某个key值匹配,那么该节点实际上已经存储在FSTbytes中,因此无需重复添加。这种方法可以避免不必要的内存冗余和提高构建效率。 此外,构建FST的过程涉及了若干步骤...

    一步一步跟我学习Lucene源码之lucene的各种Field

    10. **动态Field**:在处理动态结构的数据时,可以通过动态Field模式,以Field名的某种模式来处理不同类型的Field,增加灵活性。 了解并熟练掌握这些知识点,有助于我们更好地利用Lucene进行全文搜索和信息检索。在...

    Lucene实战(中文版第二版)对应Lucene版本

    6. **多字段搜索**:在3.0.3版本中,你可以学习如何对多个字段进行联合搜索,以及如何设置字段的权重来影响搜索结果。 7. **更新与删除**:Lucene支持动态更新和删除文档,这在实际应用中非常实用。了解如何使用`...

    lucene示例 demo+jar包

    2. **文档(Documents)**: 在 Lucene 中,文档是搜索的基本单位,可以包含多个字段(如标题、内容、作者等),每个字段都有相应的权重。 3. **分词器(Tokenizers)**: Lucene 使用分词器将文档内容分解成可搜索的...

    lucene5.0源码包

    - **自定义权重(Custom Boosting)**:允许开发者为不同的字段或查询词设置权重,提升相关性检索效果。 4. **API详解** Lucene 5.0的API更加精炼和直观,主要分为几个核心接口:`IndexWriter`用于创建和更新索引...

    lucene4.6.0 jar包

    2. **多字段搜索(Multi-Field Search)**: 用户可以同时在多个字段上进行搜索,Lucene 4.6.0 对此提供了支持,并且允许设置不同字段的权重。 3. **复杂查询支持(Advanced Query Support)**: 包括短语查询、布尔...

    Lucene5学习之Suggest关键字提示

    在实际应用中,我们还需要关注如何将Suggest与现有的Lucene搜索系统集成,以及如何设计合理的权重策略以提供最有价值的建议。同时,对于大型项目,可能需要考虑分布式Suggest服务,以应对高并发请求。 总之,Lucene...

    Lucene3.0全文信息检索

    6. **更好的国际化支持**:Lucene 3.0增加了对多种语言的支持,包括中文,改进了对非英文字符的处理。 **三、实现全文信息检索** 要使用Lucene 3.0实现全文信息检索,通常需要以下步骤: 1. **创建索引**:遍历要...

    lucene评分公式详解

    此外,Lucene还允许通过QueryParser设置查询级别的评分策略,比如使用`boost`关键字来提高某些查询词的权重。 总的来说,理解并掌握Lucene的评分公式对于优化搜索结果的质量至关重要。通过对评分公式的深入研究和...

    基于Lucene的搜索引擎的研究与应用

    新闻搜索引擎的构建过程中,可以针对新闻内容的特点进行优化,比如增加时间因子权重、优化关键词提取算法等,以提高新闻内容搜索的时效性和准确性。 9. 结论 基于Lucene的搜索引擎为特定领域,例如新闻检索,提供了...

    lucene-3.5.0.jar

    - **Boosting**:允许开发者对某些查询项或文档赋予更高的权重,以影响搜索结果的排序。 3. **高级特性** - **多字段搜索**:在一个Document中,可以针对不同Field进行独立搜索。 - **近实时搜索**:通过NRT...

    lucene-4.6.0官方文档

    此外,Boosting允许对特定查询条件赋予更高的权重,影响搜索结果的排序。 6. **性能优化** 为了提高性能,开发者需要关注索引的分段策略、缓存使用、并行处理和内存管理。例如,合理设置段合并策略可以平衡索引...

    Lucene 常用功能介绍视频详解

    可以指定在哪些字段上进行查询,并可以设置每个字段的权重,以影响最终的评分。 8. **倒排索引** Lucene的核心数据结构是倒排索引,它允许快速定位包含特定词元的文档。每个词元都有一个对应的“术语表”,记录了...

    Lucene原理

    - **倒排表(Posting List)**:对于每个词项,Lucene会建立一个倒排表,记录包含该词项的所有文档ID及其对应的权重。 - **术语字典(Term Dictionary)**:存储所有词项,便于快速查找对应倒排表。 3. **查询...

    lucene中文下载

    - **多字段搜索**:可以对多个字段进行搜索,设定不同字段的权重。 - **模糊搜索**:支持通配符和模糊匹配。 - **高亮显示**:突出显示搜索结果中的匹配词汇。 - **近实时搜索**:Lucene 支持近实时搜索,即新增或...

    Lucene 3.6.2 源代码

    7. **多字段搜索(Multi-field Searching)**: Lucene允许在多个字段上同时进行搜索,通过使用MultiFieldQueryParser,用户可以指定多个字段并为每个字段分配不同的权重。 8. **近实时搜索(Near Real-time Search...

    非常详细的Lucene文档

    6. **搜索(Searching)**: 用户输入查询后,Lucene 使用查询解析器(Query Parser)将查询语句转化为内部表示,然后执行搜索算法找到匹配的文档。 **Lucene 的扩展与优化** 1. **查询解析器(Query Parsers)**: ...

Global site tag (gtag.js) - Google Analytics