本月博客排行
-
第1名
Xeden -
第2名
fantaxy025025 -
第3名
bosschen - paulwong
- johnsmith9th
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - gengyun12
- wy_19921005
- vipbooks
- e_e
- benladeng5225
- wallimn
- ranbuijj
- javashop
- jickcai
- fantaxy025025
- zw7534313
- qepwqnp
- robotmen
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- tanling8334
- arpenker
- gaojingsong
- xpenxpen
- kaizi1992
- wiseboyloves
- jh108020
- xyuma
- ganxueyun
- wangchen.ily
- xiangjie88
- Jameslyy
- luxurioust
- mengjichen
- lemonhandsome
- jbosscn
- nychen2000
- zxq_2017
- lzyfn123
- wjianwei666
- forestqqqq
- ajinn
- siemens800
- hanbaohong
- 狂盗一枝梅
- java-007
- zhanjia
- 喧嚣求静
- Xeden
最新文章列表
ElasticSearch入门-增删改查(CRUD)
转载请标明出处:http://donlianli.iteye.com/blog/1902238
ElasticSearch(名称太长,后面简称ES)作为一个搜索引擎,目前可谓是如日中天,几乎和solr齐驾并驱。关于他能做什么,跟云计算有什么关系,在此不再描述。但是ES的官方文档,特别是关于java的客户端文档,真是少的可怜,甚至连个完整的增删改的示例都没有。在此,我就献丑了。
在开始讲 ...
分布式搜索elasticsearch java API 之(一)------与集群交互
elasticsearch可以通过两种方式来连接到elasticsearch(简称es)集群,第一种是通过在你的程序中创建一个
嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信。第二种方式是用
TransportClient这个接口和es集群通信。
一 Node方式创建嵌入节点的方式如下:
import static org.elastics ...
索引模块-ICU分析插件(ICU Analysis Plugin)
ICU Analysis Plugin
The ICU analysis plugin allows for unicode normalization, collation and folding. The plugin is called elasticsearch-analysis-icu.
The plugin includes the following analysis comp ...
Jest初次使用学习记录
Jest是Elasticsearch HTTP Rest接口的java client。
官方地址:https://github.com/searchbox-io/Jest
参考资料:http://blog.mkfree.com/posts/38#
http://download.csdn.net/download/foamflower/5272726
...
Elasticsearch集成中文分词
前言
由于elasticsearch基于lucene,所以天然地就多了许多lucene上的中文分词的支持,比如 IK, Paoding, MMSEG4J等lucene中文分词原理上都能在elasticsearch上使用。当然前提是有elasticsearch的插件。 至于插件怎么开发,这里有一片文章介绍:
http://log.medcl.net/item/2011/07/diving-in ...
ES按照整个字段统计
在使用terms facets时,经常想统计一个整个字段的值出现了多少次.如果用下面的消息发送请求:
{
"query": {
"bool": {
"must": [
{
"query_string": {
"default_f ...
Elasticsearch优化
先阶段ES优化主要在两方面:1.索引数据;2.检索。
ES索引过程是为分布式,在Lucene基础上添加了tranlog来调节数据平衡。我们可以关闭tranlog进行手动调节或者调整flush_threshold_ops数,通过索引的settings:"index.translog.flush_threshold_ops": "100000" -- ...
单机搭建elasticsearch和mongodb的river
网上有许多elasticsearch和mongodb之间通过elasticsearch的mongodb-river插件建立管道的文章,这些文章都有一个要求:需要一个mongodb的集群,也就是需要至少两个mongodb的实例。原因也好理解:river插件是通过读取mongodb的oplog.rs这个表来同步mongodb中的更新的,而要oplog.rs只有在replicset中才能生效。所以本文的 ...
elasticsearch
http://baike.baidu.com/view/8005387.htm
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。
我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望我们的搜索解决方案要快 ...
通过关闭ElasticSearch的索引使索引配置变更立即生效
问题
在处理elasticsearch的时候,通常需要不断地调整索引的配置,以期达到期望的效果。最近在试验各种analyzer的效果的时候就碰到一个问题:修改索引配置后,并不能立即生效。后来才发现需要先关闭索引,然后再打开才能生效。
过程
下面是我的过程:
创建索引:
curl -XPUT http://localhost:9200/analyzetest/ -d '
{ ...
ElasticSearch的各种服务的URL
前言
elasticsearch 将各种功能、配置、服务都以API的形式暴露,这也是elasticsearch区别于其他搜索引擎框架的一个特征。这几天在看一个elasticsearch的培训资料,将资料中提到的URL单独罗列了出来。
索引相关
URL
说明
/index/_search
不解释
/_aliases
获取或操作索引的别名
/in ...
为全文检索方案更新词库
在全文检索应用中,为了提高检索的准确性,我们时常需要定期去更新分词库,以
保证各种网络用语、火文(如“屌丝”、“高帅富”,“美富白”),能正确的被识别。 目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。本文将以ik来测试新添加的分词。 下面我们开始更新词 ...
Elasticsearch改变默认的分词器
ES默认的分词器为standard, 想要改变这个, 可以设置成自定义的analyzer.
例,想要改变成配置好的ik分词器, 在config/elasticsearch.yml文件中添加如下配置即可:
index.analysis.analyzer.default.type:ik
前提当然是你已经安装了ik分词。
ElasticSearch 在string类型的字段上做排序出错的解决方案
问题
有个简单的需求:列出图书信息,并按照图书标题的字典顺序排列。
原来认为会很简单:
builder.addSort(SortBuilders.fieldSort("title").order(SortOrder.ASC));
没想到确报这样的异常:
Can’t sort on string types with more than one value ...
Elasticsearch Suggest 插件使用
插件作用: 用于做搜索提示,如搜索 ’中‘ 时, 提示’中国‘,’中华‘,’中央‘等以’中‘开头的词。
安装: plugin -url https://github.com/downloads/spinscale/elasticsearch-suggest-plugin/elasticsearch-suggest-0.0.4-0.19.0.zip -install suggest
安 ...
Java Client调用ElasticSearch做全文搜索代码示例
目前在做基于ElasticSearch的搜索实现,采用ElasticSearch提供的Java API实现,用TransportClient连接到ES的Cluster。
根据经验,一个搜索请求应该走这样的流程:
Analyzer分析Query Term
根据Analyzer的结果构建TermQuery
发送Query请求给ES
处理返回结果
想找一段Sample Code ...
Elasticsearch TermFacet 耗内存问题
解决方案有下:
1.设置cache大小和过期时间。
index.cache.field.max_size
index.cache.field.expire
例如设置:
index.cache.field.max_size: 50000 //index中每个segment中可包含的最大的entries数目
index.cache.field.expire: 10m ...