最新文章列表

ElasticSearch入门-增删改查(CRUD)

转载请标明出处:http://donlianli.iteye.com/blog/1902238   ElasticSearch(名称太长,后面简称ES)作为一个搜索引擎,目前可谓是如日中天,几乎和solr齐驾并驱。关于他能做什么,跟云计算有什么关系,在此不再描述。但是ES的官方文档,特别是关于java的客户端文档,真是少的可怜,甚至连个完整的增删改的示例都没有。在此,我就献丑了。 在开始讲 ...
donlianli 评论(3) 有17708人浏览 2013-07-09 21:48

分布式搜索elasticsearch java API 之(一)------与集群交互

elasticsearch可以通过两种方式来连接到elasticsearch(简称es)集群,第一种是通过在你的程序中创建一个 嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信。第二种方式是用 TransportClient这个接口和es集群通信。 一 Node方式创建嵌入节点的方式如下:     import static org.elastics ...
liuhuiqings 评论(0) 有2308人浏览 2013-07-03 11:07

索引模块-ICU分析插件(ICU Analysis Plugin)

ICU Analysis Plugin The ICU analysis plugin allows for unicode normalization, collation and folding. The plugin is called elasticsearch-analysis-icu. The plugin includes the following analysis comp ...
郑云飞 评论(0) 有1705人浏览 2013-05-26 08:56

Jest初次使用学习记录

Jest是Elasticsearch HTTP Rest接口的java client。 官方地址:https://github.com/searchbox-io/Jest 参考资料:http://blog.mkfree.com/posts/38#                   http://download.csdn.net/download/foamflower/5272726 ...
jkbjxy 评论(2) 有13014人浏览 2013-05-18 22:17

Elasticsearch集成中文分词

前言 由于elasticsearch基于lucene,所以天然地就多了许多lucene上的中文分词的支持,比如 IK, Paoding, MMSEG4J等lucene中文分词原理上都能在elasticsearch上使用。当然前提是有elasticsearch的插件。 至于插件怎么开发,这里有一片文章介绍: http://log.medcl.net/item/2011/07/diving-in ...
shuminghuang 评论(0) 有8959人浏览 2013-03-31 22:49

ES按照整个字段统计

在使用terms facets时,经常想统计一个整个字段的值出现了多少次.如果用下面的消息发送请求: {   "query": {     "bool": {       "must": [         {           "query_string": {             "default_f ...
sd3560531 评论(0) 有4341人浏览 2013-03-28 15:57

Elasticsearch优化

先阶段ES优化主要在两方面:1.索引数据;2.检索。 ES索引过程是为分布式,在Lucene基础上添加了tranlog来调节数据平衡。我们可以关闭tranlog进行手动调节或者调整flush_threshold_ops数,通过索引的settings:"index.translog.flush_threshold_ops": "100000"     -- ...
蔚蓝搁浅 评论(0) 有2027人浏览 2013-03-20 10:51

单机搭建elasticsearch和mongodb的river

网上有许多elasticsearch和mongodb之间通过elasticsearch的mongodb-river插件建立管道的文章,这些文章都有一个要求:需要一个mongodb的集群,也就是需要至少两个mongodb的实例。原因也好理解:river插件是通过读取mongodb的oplog.rs这个表来同步mongodb中的更新的,而要oplog.rs只有在replicset中才能生效。所以本文的 ...
shuminghuang 评论(0) 有5575人浏览 2013-03-14 16:25

elasticsearch

http://baike.baidu.com/view/8005387.htm ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望我们的搜索解决方案要快 ...
haiker 评论(0) 有1343人浏览 2013-02-26 17:06

通过关闭ElasticSearch的索引使索引配置变更立即生效

问题 在处理elasticsearch的时候,通常需要不断地调整索引的配置,以期达到期望的效果。最近在试验各种analyzer的效果的时候就碰到一个问题:修改索引配置后,并不能立即生效。后来才发现需要先关闭索引,然后再打开才能生效。   过程 下面是我的过程: 创建索引:   curl -XPUT http://localhost:9200/analyzetest/ -d ' { ...
shuminghuang 评论(0) 有3235人浏览 2013-02-19 15:39

ElasticSearch的各种服务的URL

  前言 elasticsearch 将各种功能、配置、服务都以API的形式暴露,这也是elasticsearch区别于其他搜索引擎框架的一个特征。这几天在看一个elasticsearch的培训资料,将资料中提到的URL单独罗列了出来。   索引相关   URL 说明 /index/_search 不解释 /_aliases 获取或操作索引的别名 /in ...
shuminghuang 评论(0) 有2730人浏览 2013-02-18 18:49

为全文检索方案更新词库

在全文检索应用中,为了提高检索的准确性,我们时常需要定期去更新分词库,以 保证各种网络用语、火文(如“屌丝”、“高帅富”,“美富白”),能正确的被识别。 目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。本文将以ik来测试新添加的分词。 下面我们开始更新词 ...
eagler006 评论(0) 有1951人浏览 2013-01-11 15:16

Elasticsearch改变默认的分词器

ES默认的分词器为standard, 想要改变这个, 可以设置成自定义的analyzer.   例,想要改变成配置好的ik分词器, 在config/elasticsearch.yml文件中添加如下配置即可:   index.analysis.analyzer.default.type:ik     前提当然是你已经安装了ik分词。
maxrocray 评论(0) 有6690人浏览 2013-01-08 15:46

ElasticSearch 在string类型的字段上做排序出错的解决方案

问题 有个简单的需求:列出图书信息,并按照图书标题的字典顺序排列。 原来认为会很简单:   builder.addSort(SortBuilders.fieldSort("title").order(SortOrder.ASC));  没想到确报这样的异常:   Can’t sort on string types with more than one value ...
shuminghuang 评论(2) 有9137人浏览 2013-01-06 13:49

Elasticsearch Suggest 插件使用

插件作用: 用于做搜索提示,如搜索 ’中‘ 时, 提示’中国‘,’中华‘,’中央‘等以’中‘开头的词。   安装: plugin -url https://github.com/downloads/spinscale/elasticsearch-suggest-plugin/elasticsearch-suggest-0.0.4-0.19.0.zip -install suggest    安 ...
maxrocray 评论(0) 有2994人浏览 2012-12-14 17:18

Java Client调用ElasticSearch做全文搜索代码示例

目前在做基于ElasticSearch的搜索实现,采用ElasticSearch提供的Java API实现,用TransportClient连接到ES的Cluster。 根据经验,一个搜索请求应该走这样的流程:   Analyzer分析Query Term 根据Analyzer的结果构建TermQuery 发送Query请求给ES 处理返回结果   想找一段Sample Code ...
shuminghuang 评论(5) 有19103人浏览 2012-11-21 14:37

Elasticsearch TermFacet 耗内存问题

解决方案有下:  1.设置cache大小和过期时间。    index.cache.field.max_size    index.cache.field.expire   例如设置:   index.cache.field.max_size: 50000 //index中每个segment中可包含的最大的entries数目  index.cache.field.expire: 10m ...
maxrocray 评论(0) 有3746人浏览 2012-11-01 15:02

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics