刚刚过去的双11,真是给线下运营商好好上了一课。当今的互联网真是炙手可热,大家对互联网的热情是如此之高。相信电商之间的竞争将更加的激烈和残酷,不过,搜索,作为用户体验很重要的一点,各大电商也做的越来越好。但是,我相信软件只有开始,没有结束,搜索的业务也在不停的变化。搜索技术,你值得拥有。
现在才开始谈搜索,真是汗颜。Elasticsearch的教程都写了一堆了,现在才开始谈。我们用搜索引擎,竟然没有用搜索引擎的搜索功能,真是可笑。
好了,我写这篇博文,主要是想总结一下一般的搜索业务需求。不论你在哪个行业,这些搜索业务都是通用的。如果你也有这样的业务需求,恭喜你,你找到解决问题的途径了。
先来看看你是否有以下问题。
1、用户对检索结果不满意,希望查找的内容,没有排在前面。
2、用户搜索“苹果”,希望看到的是苹果公司的产品,而不是真正的水果。
3、用户希望你的软件能够容错,写个错别字,软件能够智能提示出来。
4、用户希望搜索足够的快,就几百万的数据,别让我等得睡着了。
。。。。。。
用户就是上帝,上帝的需求也太多了吧。
好吧,你没有遇见以上问题?你是做软件的吗?
根据以上需求及搜索领域的需求,我总结出,一个完善的搜索引擎,应该至少提供以下功能(或者说能够解决以下的所有问题)。当然,想BAIDU,GOOGLE这些公司,搜索引擎都做的比我列的要好多了。
汉语搜索业务总结
1)全角转半角(全角数字转半角数字)。
2)大写转小写(英文字母)
3)错别字纠正
4)自动补全或精简(比如输入北京市,自动缩减成北京,输入河北增加对河北省的补充,有待探索)
5)繁体转简体
6)拼音转汉字
7)同义词转换
8)加权处理(比如地名加权)
9)完善的领域词库
10)相关度排序(这个差点忘了)
目前ES只做到了前两项,瞧见了吗?什么是开源软件,这么一大堆需求,开源软件只解决了三个问题。不过,你什么都没做,别人就已经替你扫清了很多障碍,还不行吗?
相关推荐
Solr、Elasticsearch和Lucene是三个在搜索引擎领域中至关重要的技术,它们共同构建了现代数据检索的基础架构。下面将分别对这三个组件进行详细解释,并探讨它们之间的关系。 **Lucene** Lucene是一个高性能、全文本...
《从Lucene到Elasticsearch:Lucene6.0,Elasticsearch 5.4》是一本深入探讨全文检索技术的书籍,旨在帮助读者理解从基础的搜索引擎库Lucene到分布式搜索引擎Elasticsearch的过渡。书中涵盖了从核心技术概念到实际...
分享一套完整版视频课程——分布式搜索引擎Elasticsearch开发实战基础篇 (ElasticSearch、ELK、搜索引擎、Lucene),本教程旨在带领大家进入搜索引擎领域,从无到有,深入浅出的讲解了什么是搜索引擎,搜索引擎的...
而Elasticsearch则基于Lucene构建,提供了一个分布式、RESTful风格的搜索和数据分析引擎,适用于实时的数据检索和分析。 首先,Lucene 4.4.0是Lucene的一个关键版本,引入了许多改进和新特性。在源码层面,我们可以...
【全文搜索Lucene & ElasticSearch】是一门关于安装和入门的课程,主要涵盖了全文检索的基本概念,Lucene和ElasticSearch的介绍,以及如何使用Java操作ElasticSearch。全文检索,顾名思义,是对非结构化数据进行搜索...
Elasticsearch是一个基于Lucene的分布式搜索服务器,其设计目的是提供一个分布式的、可扩展的全文搜索引擎,同时也具备数据的聚合和统计分析能力。而Hadoop是一个由Apache软件基金会开发的开源框架,它允许使用简单...
【ElasticSearch】是基于Apache Lucene构建的开源、分布式搜索分析引擎,主要针对文本、数字、地理以及结构化和非结构化数据提供强大的搜索功能。它的特点是具有简单的REST API、分布式架构、高效率和可扩展性。...
es也是用Java开发并使用Lucene作为其核心来实现所有索引和搜索功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。es基本是开箱即用(解压就可以用!),非常简单。Solr安装...
而 Elasticsearch将 Lucene 作为其核心来实现所有索引和搜索的功能,通过简单的 RESTful 语法来隐藏掉 Lucene 的复杂性,从而让全文搜索变得简单 ES在Lucene基础上,提供了一些分布式的实现:集群,分片,复制等。 ...
**ElasticSearch**是一款基于Lucene的分布式搜索和分析引擎,适用于全文检索、结构化数据检索等多种场景。本章节旨在帮助初学者快速掌握ElasticSearch的基础知识。 1. **基础知识**:首先,学习ElasticSearch的基本...
Elasticsearch 是一款功能强大的全文搜索引擎,而 IK Analyzer 是一个在 Lucene 上构建的智能中文分词库。本文将深入探讨如何将 Elasticsearch Analysis IK 插件应用于 Elasticsearch 中,以实现对中文文本的高效、...
Elasticsearch是一个开源的全文搜索引擎,它基于Lucene构建,被广泛用于数据分析和日志管理。在Linux平台上,Elasticsearch提供了高度可扩展性和实时性能。版本7.13.4是Elasticsearch的一个更新版本,它包含了各种...
Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...
Elasticsearch是基于Lucene的开发的搜索引擎,它支持分布式、多用户访问,可以轻松的扩展到上百台服务器,是近实时的搜索引擎,而不是实时的搜索引擎。Elasticsearch通过简单的RESTful API来隐藏Lucene的复杂性,...
Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,...
Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级...
在实际应用中,Lucene通常与Solr或Elasticsearch等工具结合使用,以提供更高级的功能,如集群管理、分布式搜索、实时索引和更丰富的搜索特性。这些工具在Lucene的基础上添加了更多管理和扩展功能,使搜索解决方案...
Elasticsearch是一款基于Lucene的分布式搜索和分析引擎,适用于全文检索、结构化数据检索等场景。它能够实时地存储、检索和分析海量的数据,并且支持多种数据类型。由于其出色的性能和丰富的功能,Elasticsearch被...
Elasticsearch,一个基于Lucene的开源搜索引擎,以其分布式、实时、可扩展的特性在IT领域备受推崇。1.7.0版是1.x系列的最终版本,标志着这一系列的成熟与稳定,同时也为后续的2.0版本铺平了道路。在这个版本中,...