`
m635674608
  • 浏览: 5054178 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

es Synonyms filter

 
阅读更多
put /my_index3
{
  "settings": {
    "analysis": {
      "filter": {
        "my_synonym_filter": {
          "type": "synonym", 
          "synonyms": [ 
            "中国,天朝",
            "北京,京城"
          ]
        }
      },
      "analyzer": {
        "my_synonyms": {
          "tokenizer": "ik",
          "filter": [
            "lowercase",
            "my_synonym_filter" 
          ]
        }
      }
    }
  }
}

   

   

put /my_index3  
{  
  "settings": {  
    "analysis": {  
      "filter": {  
        "my_synonym_filter": {  
          "type": "synonym",   
          "synonyms_path": "analysis/synonym.txt"
        }  
      },  
      "analyzer": {  
        "my_synonyms": {  
          "tokenizer": "ik",  
          "filter": [  
            "lowercase",  
            "my_synonym"   
          ]  
        }  
      }  
    }  
  }  
}  

 

 

http://localhost:9200/my_index2/_analyze?analyzer=my_synonyms&text=天朝 北京

 

   

    "tokens": [
        {
            "token": "中国", 
            "start_offset": 0, 
            "end_offset": 2, 
            "type": "SYNONYM", 
            "position": 1
        }, 
        {
            "token": "天朝", 
            "start_offset": 0, 
            "end_offset": 2, 
            "type": "SYNONYM", 
            "position": 1
        }, 
        {
            "token": "朝", 
            "start_offset": 1, 
            "end_offset": 2, 
            "type": "CN_WORD", 
            "position": 2
        }, 
        {
            "token": "北京", 
            "start_offset": 3, 
            "end_offset": 5, 
            "type": "SYNONYM", 
            "position": 3
        }, 
        {
            "token": "京城", 
            "start_offset": 3, 
            "end_offset": 5, 
            "type": "SYNONYM", 
            "position": 3
        }, 
        {
            "token": "京", 
            "start_offset": 4, 
            "end_offset": 5, 
            "type": "CN_WORD", 
            "position": 4
        }
    ]
}

 https://www.elastic.co/guide/en/elasticsearch/guide/current/using-synonyms.html

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-synonym-tokenfilter.html

 

 

 

http://localhost:9200/zzm/_analyze?analyzer=ik&text=中华人民共和国

 

http://localhost:9200/zzm/_analyze?analyzer=mmseg&text=中华人民共和国

 

http://localhost:9200/zzm/_analyze?analyzer=pinyin&text=中华人民共和国

 

http://localhost:9200/zzm/_analyze?field=content&text=中华人民共和国

 

http://localhost:9200/my_index/_analyze?analyzer=my_synonyms&text=Elizabeth is the English queen

 

http://localhost:9200/my_index2/_analyze?analyzer=my_synonyms&text=天朝 北京

 

http://localhost:9200/my_index2/_analyze?analyzer=my_synonyms&text=布鼓雷门

 

http://localhost:9200/zzm/_analyze?analyzer=ik_max_word_syno&text=番茄

 

http://localhost:9200/zzm/_analyze?analyzer=ik_max_word_syno&text=es 

 

http://localhost:9200/synonym/_analyze?analyzer=mmseg_synonym&text=番茄

分享到:
评论

相关推荐

    elasticsearch-analysis-dynamic-synonym-7.2.0

    Elasticsearch(ES)是一款功能强大的全文搜索引擎,广泛应用于数据检索、数据分析等领域。为了提高搜索的准确性和便利性,Elasticsearch提供了丰富的分析插件,其中"elasticsearch-analysis-dynamic-synonym-7.2.0...

    elasticsearch-analysis-dynamic-synonym-7.6.2

    Elasticsearch(ES)作为一款强大的全文搜索引擎,同样支持对同义词的处理。`elasticsearch-analysis-dynamic-synonym-7.6.2`是一个专为ES7.6.2版本设计的动态同义词插件,旨在实现同义词的动态加载和管理,使得同义...

    elasticsearch-analysis-dynamic-synonym7.8.1

    **Elasticsearch 同义词插件详解** 在搜索引擎领域,Elasticsearch 是一款非常流行的开源全文搜索引擎。它提供了一种高效、灵活的方式来存储、搜索和分析大量数据。然而,对于自然语言处理,同义词的处理是必不可少...

    Elasticsearch商超同义词库.txt

    ES搜索引擎同义词库

    最新版windows elasticsearch-analysis-ik-7.13.3.zip

    《深入理解Elasticsearch Analysis IK插件在Windows环境下的应用》 在当今大数据时代,搜索引擎技术扮演着至关重要的角色,而Elasticsearch作为一款强大的开源搜索引擎,被广泛应用于日志分析、监控系统以及数据...

    Elasticsearch7.10.0集成IK相关性同义词改源码实现MySql5.7.2实现远程动态同义词词库实时更新.pdf

    在Elasticsearch(ES)中,相关性同义词的处理对于改善搜索结果的质量至关重要,尤其是当用户期望通过搜索一个词来召回具有相似含义的其他词语时。为了实现这一目标,可以通过自定义分词器并维护同义词的方式来达到...

    基于HanLP自然语言处理包的elasticsearch分词器 hanlp-tokenizer-master

    基于HanLP自然语言处理包的elasticsearch分词器 功能 本分词器使用HanLP提供的维特比分词 屏蔽了本地配置用户词典 增加同义词索引功能 增加远程词典热更新(用户词典,停词典,同义词典) 使用 目前支持的es版本为...

    English_Synonyms.zip

    English_Synonyms linking-words list-of-synonyms-and-antonyms synonyms-actions synonyms-movements synonyms-positive-feelings synonyms-negative-feelings synonyms-speech-discuss synonyms-speech-talk

    elasticsearch-synonyms-reloader

    【elasticsearch-synonyms-reloader】是一个专门为Elasticsearch设计的工具,用于便捷地动态重载同义词库。在Elasticsearch中,同义词是优化搜索效果的重要手段,它允许用户输入的关键词与索引中的多个相关词汇匹配...

    Elasticsearch权威指南

    **Elasticsearch权威指南** Elasticsearch是一款开源的全文搜索引擎,基于Lucene构建,具有分布式、实时、可扩展性好、容错性强等特性。它不仅是一个搜索库,还提供了数据存储、分析和检索的强大功能,广泛应用于...

    Python-synonyms中文近义词工具包

    Python-synonyms中文近义词工具包是一款专为自然语言处理(NLP)设计的库,它在Python开发中扮演着重要角色,特别是在涉及到文本分析、理解和生成的任务中。synonyms库提供了丰富的功能,帮助开发者解决多种问题,如...

    linux elasticsearch 7.17.0

    11. **插件安装**:Elasticsearch支持丰富的社区插件,如用于增强搜索体验的Analyzed Synonyms,或者用于性能监控的X-Pack(商业版)等。 12. **优化与调优**:为了获得最佳性能,需要关注硬件配置(如内存、CPU、...

    synonyms中文近义词工具包

    《synonyms中文近义词工具包在JavaScript开发中的应用与实践》 在现代信息技术领域,自然语言处理(NLP)已经成为一个不可或缺的部分,它广泛应用于各种场景,如文本分析、智能搜索、机器翻译等。而synonyms中文...

    python synonyms中所需的中文词向量文件

    python synonyms中所需的中文词向量文件,下载后请放置于/root/anaconda3/lib/python3.6/site-packages/synonyms/data/words.vector.gz

    synonyms_words.txt

    - **标题**:“synonyms_words.txt”——该文件主要记录了一系列同义词集合。 - **描述**:“synonyms_words词林”——表明这是一份同义词汇编,如同一片词汇的森林,内容丰富。 #### 二、标签解析 - **标签**:...

    synonyms-3.10.1.tar.gz

    《Python中的同义词计算工具包:synonyms-3.10.1》 在Python的世界里,处理自然语言是一项常见的任务,而synonyms-3.10.1是一个专门用于计算词语同义性的工具包,它为开发者提供了一种高效、简便的方式来探索词汇的...

    中文同义词词库synonyms下载

    中文同义词词库下载,3w条同义词和近义词。基本囊括了常见的所有词,可以用于机器学习,自然语言处理,搜索等。

    elasticsearch-8.1.2+对应的ik分词器

    **Elasticsearch 8.1.2 和 IK 分词器详解** Elasticsearch 是一个流行的开源全文搜索引擎,基于 Lucene 库,广泛应用于大数据环境中的数据检索和分析。它提供了实时、分布式、高可扩展的搜索和分析能力,是许多企业...

    synonyms_xiangshidu.txt

    本次介绍的“synonyms_xiangshidu.txt”文件包含了丰富的同义词数据,涉及广泛的主题和领域,对于研究同义词关系及其应用具有较高的价值。 #### 二、文件结构解析 该文件采用特定格式记录了大量同义词及其相似度...

Global site tag (gtag.js) - Google Analytics