本月博客排行
-
第1名
宏天软件 -
第2名
kaizi1992 -
第3名
vipbooks - wallimn
- arpenker
- daizj
- xpenxpen
- zhangjijun
- sunnylocus
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
wy_19921005 - gashero
- gengyun12
- robotmen
- vipbooks
- fantaxy025025
- 大家都说我很棒
- wallimn
- hbxflihua
- qepwqnp
- e_e
- 解宜然
- ranbuijj
- javashop
- zw7534313
- ssydxa219
- jickcai
- sam123456gz
- gdpglc
- zysnba
- sichunli_030
- tanling8334
- appalese
- benladeng5225
- gaojingsong
- wiseboyloves
- zhangyi0618
- xpenxpen
- jh108020
- luxurioust
- xyuma
- nychen2000
- 龙哥IT
- arpenker
- wjianwei666
- wangchen.ily
- jbosscn
- lzyfn123
- 狂盗一枝梅
- kaizi1992
- java-007
- Jameslyy
- hanbaohong
- xiangjie88
- mengjichen
- silverend
- ajinn
- zxq_2017
最新文章列表
Elasticsearch 控制相关度 (二) - Lucene中的PSF(Practical Scoring Function)与查询期间提升
原文链接:http://blog.csdn.net/dm_vincent/article/details/42113401
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
Lucene中的Practical Scoring Function
对于多词条查询(Multiterm Queries),Lucene使用的是布尔 ...
Elasticsearch 控制相关度 (一) - 相关度分值计算背后的理论
原文链接:http://blog.csdn.net/dm_vincent/article/details/42099063
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
控制相关度(Controlling Relevance)
对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系 ...
Elasticsearch 部分匹配 (四) - 索引期间优化ngrams及索引期间的即时搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/42076191
本章翻译自Elasticsearch官方指南的Partial Matching一章。
索引期间的优化(Index-time Optimizations)
目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Index ...
eclipse启动报错
eclipse启动web项目突然出现如下异常,
java.lang.LinkageError: loader constraint violation: loader (instance of org/apache/catalina/loader/WebappClassLoader) previously initiated loading for a different type with ...
Elasticsearch 部分匹配 (三) - 查询期间的即时搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/42059387
本章翻译自Elasticsearch官方指南的Partial Matching一章。
查询期间的即时搜索(Query-time Search-as-you-type)
现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就 ...
Elasticsearch 部分匹配 (二) - 通配符及正则表达式查询
原文链接:http://blog.csdn.net/dm_vincent/article/details/42024799
通配符和正则表达式查询
wildcard查询和prefix查询类似,也是一个基于词条的低级别查询。但是它能够让你指定一个模式(Pattern),而不是一个前缀(Prefix)。它使用标准的shell通配符:?用来匹配任意字符,*用来匹配零个或者多个字符。
以 ...
Elasticsearch 部分匹配 (一) - 前缀查询
原文链接:http://blog.csdn.net/dm_vincent/article/details/42001851
部分匹配(Partial Matching)
敏锐的读者可能已经发现到目前为止,介绍的查询都是在整个词条层面进行操作的。匹配的最小单元必须是一个词条。你只能找到存在于倒排索引(Inverted Index)中的词条。
但是如果你想匹配词条的一部分,而不是整个词条呢 ...
Elasticsearch 邻近匹配 (三) - 性能,关联单词查询以及Shingles
原文链接:http://blog.csdn.net/dm_vincent/article/details/41978363
提高性能
短语和邻近度查询比简单的match查询在性能上更昂贵。match查询只是查看词条是否存在于倒排索引(Inverted Index)中,而match_phrase查询则需要计算和比较多个可能重复词条(Multiple possibly repeated)的位 ...
Elasticsearch 邻近匹配 (二) - 多值字段,邻近程度与相关度
原文链接:http://blog.csdn.net/dm_vincent/article/details/41956229
多值字段(Multivalue Fields)
在多值字段上使用短语匹配会产生古怪的行为:
PUT /my_index/groups/1
{
"names": [ "John Abraham", " ...
Elasticsearch 邻近匹配 (一) - 短语匹配以及slop参数
原文链接:http://blog.csdn.net/dm_vincent/article/details/41941659
本文翻译自Elasticsearch官方指南的Proximity Matching一章。
邻近匹配(Proximity Matching)
使用了TF/IDF的标准全文搜索将文档,或者至少文档中的每个字段,视作"一大袋的单词" ...
Elasticsearch 多字段搜索 (五) - 以字段为中心的查询 + 自定义_all字段,跨域查询及精确值字段
原文链接:http://blog.csdn.net/dm_vincent/article/details/41863015
以字段为中心的查询(Field-centric Queries)
上述提到的三个问题都来源于most_fields是以字段为中心(Field-centric),而不是以词条为中心(Term-centric):它会查询最多匹配的字段(Most matching ...
Elasticsearch 多字段搜索 (四) - 跨字段实体搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/41862967
跨字段实体搜索(Cross-fields Entity Search)
现在让我们看看一个常见的模式:跨字段实体搜索。类似person,product或者address这样的实体,它们的信息会分散到多个字段中。我们或许有一个person实体被索引如下:
{
...
Elasticsearch 多字段搜索 (二) - 最佳字段查询及其调优
原文链接:http://blog.csdn.net/dm_vincent/article/details/41820537
最佳字段(Best Fields)
假设我们有一个让用户搜索博客文章的网站,就像这两份文档一样:
PUT /my_index/my_type/1
{
"title": "Quick brown rabbits&q ...
Elasticsearch 多字段搜索 (一) - 多个及单个查询字符串
原文链接:http://blog.csdn.net/dm_vincent/article/details/41800351
多字段搜索(Multifield Search)
本文翻译自官方指南的Multifield Search一章。
查询很少是只拥有一个match查询子句的查询。我们经常需要对一个或者多个字段使用相同或者不同的查询字符串进行搜索,这意味着我们需要将多个查询子句 ...
Elasticsearch 全文搜索 (四) - 控制分析及相关度
原文链接:http://blog.csdn.net/dm_vincent/article/details/41773959
控制分析(Controlling Analysis)
查询只能摘到真实存在于倒排索引(Inverted Index)中的词条(Term),因此确保相同的分析过程会被适用于文档的索引阶段和搜索阶段的查询字符串是很重要的,这样才能够让查询中的词条能够和倒排索引中的词条匹 ...
Elasticsearch 全文搜索 (三) - match查询和bool查询的关系,提升查询子句
原文链接:http://blog.csdn.net/dm_vincent/article/details/41743955
match查询是如何使用bool查询的
现在,你也许意识到了使用了match查询的多词查询只是简单地将生成的term查询包含在了一个bool查询中。通过默认的or操作符,每个term查询都以一个语句被添加,所以至少一个
Elasticsearch 全文搜索 (二) - 多词查询及查询的合并
原文链接:http://blog.csdn.net/dm_vincent/article/details/41720193
多词查询(Multi-word Queries)
如果我们一次只能搜索一个词,那么全文搜索就会显得相当不灵活。幸运的是,通过match查询来实现多词查询也同样简单:
GET /my_index/my_type/_search
{
"qu ...
Elasticsearch 全文搜索 (一) - 基础概念和match查询
原文链接:http://blog.csdn.net/dm_vincent/article/details/41693125
翻译自官方指南的全文搜索一章
全文搜索(Full Text Search)
现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档。
对于全文搜索而言,最重要的两个方面是:
相关度(Releva ...
Elasticsearch 分布式搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/41277737
本文翻译自Elasticsearch官方指南的Distributed Search Execution一章。
在继续之前,我们将绕一段路来谈谈在分布式环境中,搜索是如何执行的。和在分布式文档存储(Distributed Document Store)中讨论的 ...
Elasticsearch 分布式文档存储
原文链接:http://blog.csdn.net/dm_vincent/article/details/41242565
本文翻译自Elasticsearch官方指南的distributed document store一章。
分布式文档存储
在上一章中, ...