`

ElasticSearch初学【转载】

阅读更多
转载请标明出处:http://donlianli.iteye.com/blog/1902238

ElasticSearch(名称太长,后面简称ES)作为一个搜索引擎,目前可谓是如日中天,几乎和solr齐驾并驱。关于他能做什么,跟云计算有什么关系,在此不再描述。但是ES的官方文档,特别是关于java的客户端文档,真是少的可怜,甚至连个完整的增删改的示例都没有。在此,我就献丑了。
在开始讲解之前,还是先做个铺垫,为了能够有一个可以索引的模型,我们自定义了一个模型,暂时起个名称叫LogModel吧,这个模型有各种数据类型,int,long,String,list,但千万不要认为这是跟记录日志有关的一个模型。作为索引的一个最简单模型。代码如下:
Java代码  收藏代码
import java.util.ArrayList; 
import java.util.List; 
import java.util.Random; 
import java.util.UUID; 
/**
* 瞎编的一个模型,跟日志基本没有关系
* @author donlian
*/ 
public class LogModel { 
    //主ID 
    private long id; 
    //次ID 
    private int subId; 
    /**
     * 系统名称
     */ 
    private String systemName; 
    private String host; 
     
    //日志描述 
    private String desc; 
    private List<Integer> catIds; 
    public LogModel(){ 
        Random random = new Random(); 
        this.id = Math.abs(random.nextLong()); 
        int subId = Math.abs(random.nextInt()); 
        this.subId = subId; 
        List<Integer> list = new ArrayList<Integer>(5); 
        for(int i=0;i<5;i++){ 
            list.add(Math.abs(random.nextInt())); 
        } 
        this.catIds = list; 
        this.systemName = subId%1 == 0?"oa":"cms"; 
        this.host = subId%1 == 0?"10.0.0.1":"10.2.0.1"; 
        this.desc = "中文" + UUID.randomUUID().toString(); 
    } 
    public LogModel(long id,int subId,String sysName,String host,String desc,List<Integer> catIds){ 
        this.id = id; 
        this.subId = subId; 
        this.systemName = sysName; 
        this.host = host; 
        this.desc = desc; 
        this.catIds = catIds; 
    } 
...//省去get,set方法 

同时,因为ES在索引的时候,一般都用json格式,因此,使用jackson定义了一个将对象转化成json的工具类,也很简单,代码:
Java代码  收藏代码
public class ESUtils { 
    private static ObjectMapper objectMapper = new ObjectMapper(); 
    public static String toJson(Object o){ 
        try { 
            return objectMapper.writeValueAsString(o); 
        } catch (JsonProcessingException e) { 
            e.printStackTrace(); 
        } 
        return ""; 
    } 

在开始进行操作ES服务器之前,我们必须得获得ES的API,简单介绍一下ES操作服务器的两种方式,一种是使用Node方式,即本机也启动一个ES,然后跟服务器的ES进行通信,这个node甚至还能存储(奇怪,一般需要这样的方式吗?),另一种,就是下面我介绍的这一种,通过一个对象使用http协议跟服务器进行交互。
获得一个ES客户端API的代码如下:
Java代码  收藏代码
Settings settings = ImmutableSettings.settingsBuilder() 
                //指定集群名称 
                .put("cluster.name", "elasticsearch") 
                //探测集群中机器状态 
                .put("client.transport.sniff", true).build(); 
        /*
         * 创建客户端,所有的操作都由客户端开始,这个就好像是JDBC的Connection对象
         * 用完记得要关闭
         */ 
        Client client = new TransportClient(settings) 
        .addTransportAddress(new InetSocketTransportAddress("192.168.1.106", 9300)); 
Client对象,可以理解为数据库的Connection对象。好了,准备工作完成,下面就开始增删改查。
Index(增加)

ES里面的增加对象不叫什么add,save等,叫index。但无论叫什么名称,反正就是向ES服务器里面加数据。上面说过一个对象转json的工具类,其实ES的API中,是自带构建json的工具类的。
Java代码  收藏代码
import org.elasticsearch.action.index.IndexResponse; 
import org.elasticsearch.client.Client; 
import org.elasticsearch.client.transport.TransportClient; 
import org.elasticsearch.common.settings.ImmutableSettings; 
import org.elasticsearch.common.settings.Settings; 
import org.elasticsearch.common.transport.InetSocketTransportAddress; 
 
import com.donlianli.es.ESUtils; 
import com.donlianli.es.model.LogModel; 
/**
* 向ES添加索引对象
* @author donlian
*/ 
public class IndexTest { 
    public static void main(String[] argv){ 
        Settings settings = ImmutableSettings.settingsBuilder() 
                //指定集群名称 
                .put("cluster.name", "elasticsearch") 
                //探测集群中机器状态 
                .put("client.transport.sniff", true).build(); 
        /*
         * 创建客户端,所有的操作都由客户端开始,这个就好像是JDBC的Connection对象
         * 用完记得要关闭
         */ 
        Client client = new TransportClient(settings) 
        .addTransportAddress(new InetSocketTransportAddress("192.168.1.106", 9300)); 
        String json = ESUtils.toJson(new LogModel()); 
        //在这里创建我们要索引的对象 
        IndexResponse response = client.prepareIndex("twitter", "tweet") 
                //必须为对象单独指定ID 
                .setId("1") 
                .setSource(json) 
                .execute() 
                .actionGet(); 
        //多次index这个版本号会变 
        System.out.println("response.version():"+response.version()); 
        client.close(); 
    } 

运行这个代码,就向ES插入了一条数据,你运行两遍,还是一条。ES根据你设置的ID来设置对象,如果没有则插入,有则更新。每更新一次,对应的version加1.
好了,在次,使用以下命令,应该能够查询到一条记录了。
Java代码  收藏代码
curl -XGET 'http://localhost:9200/twitter/tweet/1' 

delete(删除)

有了增加的例子,删除的例子也就好写了。增加是prepareIndex,删除是prepareDelete,查询就是PrepareGet。
代码如下:
Java代码  收藏代码
import org.elasticsearch.action.delete.DeleteResponse; 
import org.elasticsearch.client.Client; 
import org.elasticsearch.client.transport.TransportClient; 
import org.elasticsearch.common.settings.ImmutableSettings; 
import org.elasticsearch.common.settings.Settings; 
import org.elasticsearch.common.transport.InetSocketTransportAddress; 
 
import com.donlianli.es.ESUtils; 
 
public class DeleteTest { 
    public static void main(String[] argv){ 
        Settings settings = ImmutableSettings.settingsBuilder() 
                //指定集群名称 
                .put("cluster.name", "elasticsearch") 
                //探测集群中机器状态 
                .put("client.transport.sniff", true).build(); 
        /*
         * 创建客户端,所有的操作都由客户端开始,这个就好像是JDBC的Connection对象
         * 用完记得要关闭
         */ 
        Client client = new TransportClient(settings) 
        .addTransportAddress(new InetSocketTransportAddress("192.168.1.106", 9300)); 
        //在这里创建我们要索引的对象 
        DeleteResponse response = client.prepareDelete("twitter", "tweet", "1") 
                .execute().actionGet(); 
        System.out.println(response.getId()); 
        System.out.println(ESUtils.toJson(response.getHeaders())); 
    } 


GET(查询)

Java代码  收藏代码
import org.elasticsearch.action.get.GetResponse; 
import org.elasticsearch.client.Client; 
import org.elasticsearch.client.transport.TransportClient; 
import org.elasticsearch.common.settings.ImmutableSettings; 
import org.elasticsearch.common.settings.Settings; 
import org.elasticsearch.common.transport.InetSocketTransportAddress; 
 
public class GetTest { 
    public static void main(String[] argv){ 
        Settings settings = ImmutableSettings.settingsBuilder() 
                //指定集群名称 
                .put("cluster.name", "elasticsearch") 
                //探测集群中机器状态 
                .put("client.transport.sniff", true).build(); 
        /*
         * 创建客户端,所有的操作都由客户端开始,这个就好像是JDBC的Connection对象
         * 用完记得要关闭
         */ 
        Client client = new TransportClient(settings) 
        .addTransportAddress(new InetSocketTransportAddress("192.168.1.106", 9300)); 
        //在这里创建我们要索引的对象 
        GetResponse response = client.prepareGet("twitter", "tweet", "1") 
                .execute().actionGet(); 
        System.out.println("response.getId():"+response.getId()); 
        System.out.println("response.getSourceAsString():"+response.getSourceAsString()); 
    } 

好了,增删改查的代码写完。至于搜索,那是一个比较深入的话题,我也在慢慢探索。我时间我会继续写下去。

更多有关elasticsearch的内容,请浏览专栏:http://www.iteye.com/blogs/subjects/elasticsearch-tutor
分享到:
评论

相关推荐

    elasticsearch-7.17.6及对应版本IK分词

    适合人群:elasticsearch初学者 Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式...

    ES查询客户端,elasticsearch可视化工具 elasticsearch查询客户端

    Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...

    (狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战)

    (狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战),包含了小狂神讲的东西,特别适合新手学习,笔记保存下来可以多看看。好记性不如烂笔头哦~,ElasticSearch,简称es,es是一个...

    ES客户端+谷歌浏览器插件+Multi-Elasticsearch-Head

    多弹性搜索头,对著名的 Elasticsearch Head 的改进 1.保存和存储几个Elasticsearch端点 2.索引选项卡中的更多列 3. 任何请求现在都可以像 /_cat/indices 一样处理 JSON 返回 4. 更简约的外观(更小的字体等...) ...

    elasticsearch 8.11.3 windows安装包

    Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,...

    7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器

    适用于7.17.1系列,例如Elasticsearch的7.17.12版本。 elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个...

    elasticSearch(ES)最新版 ik分词插件7.10 elasticsearch-analysis-ik-7.10.0

    Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...

    elasticsearch elasticsearch-6.2.2 elasticsearch-6.2.2.zip 下载

    根据提供的文件信息,我们可以推断出本篇文章将围绕Elasticsearch 6.2.2版本进行详细介绍,包括其下载方式、主要功能特性以及在实际应用中的常见用途。 ### Elasticsearch简介 Elasticsearch是一款基于Lucene的...

    Windows版本(8.11)ElasticSearch、elasticsearch-head、kibana、IK分词

    **Elasticsearch 8.11 for Windows** Elasticsearch 是一个开源的分布式搜索引擎,以其高可伸缩性、实时性、灵活性以及强大的数据分析能力而闻名。在Windows平台上部署Elasticsearch,用户可以利用其强大的搜索和...

    es-head Elasticsearch的可视化操作插件

    es-head是一个针对Elasticsearch的可视化操作插件。它提供了一个便捷的操作工具,可以连接Elasticsearch搜索引擎,并提供可视化的操作页面,对Elasticsearch进行各种设置和数据检索功能的管理。 es-head 插件可以在...

    Elasticsearch 开机自启脚本

    `start` 用于启动Elasticsearch,这里使用 `su` 命令切换到指定的Elasticsearch用户(例如 `es-admin`),然后进入Elasticsearch的安装目录并执行 `bin/elasticsearch` 文件以后台模式启动服务。`stop` 通过查找并杀...

    Elastic Search搭建使用教程.pdf(内含ElasticSearch教程权威指南)

    Elasticsearch是一款基于Lucene的开源搜索引擎,它使用RESTful接口进行数据操作,数据以JSON格式存储。Elasticsearch以其高效的全文搜索功能,实时数据处理能力,以及易于使用的特性,在众多企业中得到了广泛应用,...

    elasticsearch服务器安装包

    2. **下载安装包**:这里的"es安装包"即为Elasticsearch的安装文件,通常是一个zip或tar.gz格式的压缩包。你需要从官方网站或者镜像站点下载对应版本的安装包,确保与你的系统兼容。 3. **解压安装**:下载完成后,...

    elasticsearch7.14.0.zip

    Elasticsearch 7.14.0 是一个高度可扩展的全文搜索引擎,广泛应用于日志分析、实时数据分析和全文检索等多个领域。这个压缩包包含了针对Windows和Linux操作系统的安装包,便于在不同环境下部署和使用Elasticsearch。...

    Elasticsearch 开发手册

    在数据抽取 ELT 领域,ES 全家桶 ELK(Elasticsearch+Logstash+Kibana)赫赫有名。 Elasticsearch 基本概念: * 倒排索引:Elasticsearch 为什么快,核心设计理念就是采用了倒排索引机制。倒排索引的方式是,根据 ...

    elasticSearch-8.14.1-windows

    Elasticsearch 8.14.1 是一个高度可扩展的开源全文检索和分析引擎,专为分布式环境设计。它允许开发者和系统管理员快速、高效地存储、搜索和分析大量数据。Elasticsearch 广泛应用于日志分析、信息检索、网站搜索、...

    elasticsearch windows 7.17.16 解压安装包

    Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,...

    适用于elasticsearch7.12.1版本

    Elasticsearch 7.12.1 是一个强大的开源全文搜索引擎,它基于 Lucene 库进行构建,提供了分布式、实时的搜索和分析引擎服务。这个版本的 Elasticsearch 针对性能和稳定性进行了优化,适用于大规模数据检索和分析场景...

    基于.netcore搜索封装ElasticSearch.zip

    这个名为"基于.netcore搜索封装ElasticSearch.zip"的压缩包,显然包含了一个针对.NET Core平台的Elasticsearch客户端库,方便开发者在.NET Core应用中集成和操作Elasticsearch。 Elasticsearch是一个开源的分布式...

Global site tag (gtag.js) - Google Analytics