`
m635674608
  • 浏览: 5053504 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

elasticsearch中template引见

 
阅读更多

lasticsearch中template介绍

template中规定了数据的存储格式、分片数量等信息,下边是一个elasticsearch中template例子:

 

 
  1. http://192.168.1.215:9200/_template/content_tpl  
  2. PUT  
  3. {
      "template": "content_*",
      "settings": {
        "number_of_shards": 1,
        "index.mapper.dynamic": false
      },
      "mappings": {
        "doc": {
          "properties": {
            "id": {
              "type": "long",
              "store": "yes"
            },
            "url": {
              "type": "string",
              "index": "not_analyzed",
              "omit_norms": "true",
              "store": "yes"
            },
            "signature": {
              "type": "string",
              "index": "not_analyzed",
              "omit_norms": "true",
              "store": "yes"
            },
            "keyword": {
              "type": "string",
              "index_analyzer": "lezhi_keyword",
              "index_options": "positions",
              "omit_norms": "true",
              "store": "no"
            },
            "count": {
              "type": "int",
              "index": "no",
              "store": "yes"
            },
            "lastModified": {
              "type": "long",
              "store": "yes"
            }
          }
        }
      }
    }
     

 

template大致分成setting和mappings两部分:

 

1. settings主要作用于index的一些相关配置信息,如分片数、副本数,tranlog同步条件、refresh等。

 

2. mappings主要是一些说明信息,大致又分为_all、_source、prpperties这三部分:

 

     (1) _all:主要指的是AllField字段,我们可以将一个或多个都包含进来,在进行检索时无需指定字段的情况下检索多个字段。设置“_all" : {"enabled" : true}

 

     (2) _source: 主要指的是SourceField字段,Source可以理解为ES除了将数据保存在索引文件中,另外还有一份源数据。_source字段在我们进行检索 时相当重要,如果在{"enabled" : false}情况下默认检索只会返回ID, 你需要通过Fields字段去到索引中去取数据,效率不是很高。但是enabled设置为true时,索引会比较大,这时可以通过Compress进行压 缩和inclueds、excludes来在字段级别上进行一些限制,自定义哪些字段允许存储。

 

     (3) properties:这是最重要的步伐,主要针对索引结构和字段级别上的一些设置。

 

一些详细解释可以参考 http://www.elasticsearch.org/guide/reference/mapping/

 

下面详细介绍properties中的一些配置

 

1. index_options 

 

    Add index_options (applicable to string type) with values of:

 

    (1) docs: only documents are indexed, term frequencies and positions are omitted.

 

    (2) freqs: documents and term frequencies are index, positions are omitted.
    (3) positions: documents, term frequencies, and positions are indexed.
    see: http://https://github.com/elasticsearch/elasticsearch/issues/2346

 

    positions选项可以让lucene跳过对该项的出现频率和出现位置的索引,还可以节省一些索引在磁盘上的存储空间,还可以加速搜索和过滤过程,但是会但是悄悄阻止需要位置信息的搜索,如阻止PhraseQuery和SpanQuery类的运行

 

2. index

 

    (1) analyzed -- 使用分词器将域值分解成独立的语汇单元流,并使每个语汇单元能被搜到,适用于普通文本域(如正文、标题、摘要等),通常需要设置“index_analyzer"。
    (2) not_analyzed -- 对域进行索引,但不对String值进行分析,实际上将域值作为 单一语汇单元并使之能本搜索,适用于不能被分解的域值,如URL、文件路径、日期、电话等。
    (3) no -- 使用对应的域值不被搜索
3. omit_norms

 

    norms记录了索引中index-time boost信息,但是当你进行搜索时可能会比较耗费内存。omit_norms = true则是忽略掉域加权信息,这样在搜索的时候就不会处理索引时刻的加权信息了。

 

4. store

 

    域存储选项store,用来确定是否需要存储域的真实值,以便后续搜集时能恢复这个值。

 

    (1) yes -- 指定存储域值。该情况下,原始的字符串全部被保存在索引中,并可以由IndexReader类恢复。该选项对于需要展示搜索结果的一些域很有用(如URL、标题等)。如果索引的大小在搜索程序考虑之列的话,不要存储太大的域值,因为这些域值会消耗掉索引的存储空间。
    (2) no -- 指定不存储域值。该选项通常跟Index.ANALYZED选项共同用来索引大的文本域值,这些域值不用恢复初始格式,如文本正文。

 

http://www.myexception.cn/open-source/2032568.html

分享到:
评论

相关推荐

    ElasticSearch Java API 中文文档

    标签《ES Java API 中文文档》强调了文档的内容属性,它属于ElasticSearch的一个重要组成部分,即用Java语言进行数据交互和操作的应用程序接口部分。 从部分内容中可以提取出以下知识点: 1. **Transport Client**...

    ES查询客户端,elasticsearch可视化工具 elasticsearch查询客户端

    Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...

    elasticsearch-6.8.3-API文档-中文版.zip

    赠送jar包:elasticsearch-6.8.3.jar; 赠送原API文档:elasticsearch-6.8.3-javadoc.jar; 赠送源代码:elasticsearch-6.8.3-sources.jar; 赠送Maven依赖信息文件:elasticsearch-6.8.3.pom; 包含翻译后的API文档...

    7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器

    elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点: 中文分词:elasticsearch-analysis-ik 是基于...

    elasticsearch 8.11.3 windows安装包

    Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,并管理和监控堆栈。 Elasticsearch 为所有类型的数据提供近乎实时的...

    (狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战)

    (狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战),包含了小狂神讲的东西,特别适合新手学习,笔记保存下来可以多看看。好记性不如烂笔头哦~,ElasticSearch,简称es,es是一个...

    Windows版本(8.11)ElasticSearch、elasticsearch-head、kibana、IK分词

    2. **环境变量设置**: 将Elasticsearch的bin目录添加到系统的PATH环境变量,以便于在命令行中直接运行Elasticsearch。 3. **启动Elasticsearch**: 运行`bin/elasticsearch.bat`启动服务。注意,Elasticsearch默认...

    elasticSearch(ES)最新版 ik分词插件7.10 elasticsearch-analysis-ik-7.10.0

    Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...

    ES客户端+谷歌浏览器插件+Multi-Elasticsearch-Head

    多弹性搜索头,对著名的 Elasticsearch Head 的改进 1.保存和存储几个Elasticsearch端点 2.索引选项卡中的更多列 3. 任何请求现在都可以像 /_cat/indices 一样处理 JSON 返回 4. 更简约的外观(更小的字体等...) ...

    Elastic Search搭建使用教程.pdf(内含ElasticSearch教程权威指南)

    Elasticsearch以其高效的全文搜索功能,实时数据处理能力,以及易于使用的特性,在众多企业中得到了广泛应用,包括维基百科、Stack Overflow以及GitHub等。Elasticsearch的分布式特性意味着它能够水平扩展到数百台...

    Elasticsearch平台中文分词词库.txt

    Elasticsearch电商平台中文分词词库

    Elasticsearch 开机自启脚本

    `start` 用于启动Elasticsearch,这里使用 `su` 命令切换到指定的Elasticsearch用户(例如 `es-admin`),然后进入Elasticsearch的安装目录并执行 `bin/elasticsearch` 文件以后台模式启动服务。`stop` 通过查找并杀...

    elasticsearch elasticsearch-6.2.2 elasticsearch-6.2.2.zip 下载

    根据提供的文件信息,我们可以推断出本篇文章将围绕Elasticsearch 6.2.2版本进行详细介绍,包括其下载方式、主要功能特性以及在实际应用中的常见用途。 ### Elasticsearch简介 Elasticsearch是一款基于Lucene的...

    wazuh-elastic7-template-alerts.json

    wazuh-elastic7-template-alerts.json,wazuh的ES模块导入

    elasticsearch 中文文档

    学习elasticsearch,决定把自己用过的整成中文,已整理一部份,虽然不尽人意,但也尽力,有query dsl与一部分API,后续整理完了会继续更新。

    spring-data-elasticsearch中文使用文档

    Spring Data Elasticsearch 是一个强大的Java库,它使得在Elasticsearch数据库中操作数据变得更加简单。这个框架是Spring Data项目的一部分,它为Elasticsearch提供了一套全面的API和元数据驱动的编程模型,以简化...

    elasticsearch-6.2.3-API文档-中文版.zip

    赠送jar包:elasticsearch-6.2.3.jar; 赠送原API文档:elasticsearch-6.2.3-javadoc.jar; 赠送源代码:elasticsearch-6.2.3-sources.jar; 赠送Maven依赖信息文件:elasticsearch-6.2.3.pom; 包含翻译后的API文档...

    elasticsearch7.14.0.zip

    索引用于存储数据,类型是索引内的逻辑分类,文档是存储在Elasticsearch中的JSON对象,而节点是组成集群的基本单位。 2. **版本7.14.0的更新**:每个版本的Elasticsearch都有所改进和新功能。7.14.0可能包含了性能...

Global site tag (gtag.js) - Google Analytics