相似度
相似度算法
余弦相似度算法
余弦相似度是通过两个向量的夹角度数来衡量相似程度。余弦相似度充分利用了余弦定理。余弦定理在三角形图论中有阐述。
余弦
余弦定理在直角三角形中的描述。这个是最简单的情况。
a和c的夹角为,其余弦值计算公式为:
如果不是直角三角形,如下:
这个公式也可以从上面的公式推导出来
所以
如果将上面的三角形放在二维坐标系中,上面的a表示坐标点(x2,y2)到原点的距离,b表示坐标点(x1,y1)到原点的距离,c表示坐标点(x1,y1)到坐标点(x2,y2)的距离。
根据前面的推导:
所以:
头部
<1 byte,E,><1 byte,S,><4 bytes,,消息大小><8 bytes,,请求Id><1 byte,,状态><4 bytes,,版本><n bytes,,body>
body
压缩
<4 bytes,,压缩算法><n bytes,,action><n bytes,,请求内容>
不压缩
BytesTransportRequest请求
<n bytes,,action><n bytes,,请求头><n bytes,,请求内容字节长度><n bytes,,请求内容>
非BytesTransportRequest请求
<n bytes,,action><n bytes,,请求内容>
压缩算法
<1 byte,D,><1 byte,F,><1 byte,L,><1 byte,\0,>
action
如:indices:data/read/search
请求头
<1 byte,0,请求头标识>
<1 byte,1,请求头标识><n bytes,,请求头信息>
请求内容
<n bytes,,请求内容字节数据>
如:org.elasticsearch.action.search.SearchRequest
相关推荐
Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...
(狂神)ElasticSearch快速入门笔记,ElasticSearch基本操作以及爬虫(Java-ES仿京东实战),包含了小狂神讲的东西,特别适合新手学习,笔记保存下来可以多看看。好记性不如烂笔头哦~,ElasticSearch,简称es,es是一个...
es-head是一个针对Elasticsearch的可视化操作插件。它提供了一个便捷的操作工具,可以连接Elasticsearch搜索引擎,并提供可视化的操作页面,对Elasticsearch进行各种设置和数据检索功能的管理。 es-head 插件可以在...
Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...
Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于大数据领域的全文检索。它以其高可扩展性、实时性能以及丰富的分析能力著称。在中文环境下,由于汉字的复杂性,分词是实现有效搜索的关键步骤。为此,...
在IT领域,尤其是在搜索引擎优化和大数据分析中,Elasticsearch(ES)是一个广泛使用的开源全文检索引擎。它基于Lucene库,提供了分布式、实时、高可用性以及容错能力的数据存储和搜索解决方案。本篇文章将重点讲解...
docker run --name elasticsearch7.16.3 -p 127.0.0.1:9200:9200 -p 127.0.0.1:9300:9300 -e "discovery.type=single-node" -v /Users/xingyue/Home/xingyue/学习/工程化/es/elasticsearch.yml:/usr/share/elastic...
多弹性搜索头,对著名的 Elasticsearch Head 的改进 1.保存和存储几个Elasticsearch端点 2.索引选项卡中的更多列 3. 任何请求现在都可以像 /_cat/indices 一样处理 JSON 返回 4. 更简约的外观(更小的字体等...) ...
**Elasticsearch(ES)** 是一个开源的全文搜索引擎,基于Lucene构建,设计用于分布式、可扩展的数据存储和搜索。在这个"Elasticsearch Demo"项目中,我们将学习如何将Word文档的内容读取并写入Elasticsearch,以及...
ES IK分词器插件是专门为Elasticsearch搜索引擎设计的中文分词处理工具,版本为7.8.0。该插件能够有效地处理中文内容,将其分词,以便于Elasticsearch更好地进行搜索和分析操作。该插件采用智能分词技术,能够对中文...