- 浏览: 1046418 次
- 性别:
- 来自: 上海
文章分类
- 全部博客 (1441)
- 软件思想&演讲 (9)
- 行业常识 (250)
- 时时疑问 (5)
- java/guava/python/php/ruby/R/scala/groovy (213)
- struct/spring/springmvc (37)
- mybatis/hibernate/JPA (10)
- mysql/oracle/sqlserver/db2/mongdb/redis/neo4j/GreenPlum/Teradata/hsqldb/Derby/sakila (268)
- js/jquery/jqueryUi/jqueryEaseyUI/extjs/angulrJs/react/es6/grunt/zepto/raphael (81)
- ZMQ/RabbitMQ/ActiveMQ/JMS/kafka (17)
- lucene/solr/nuth/elasticsearch/MG4J (167)
- html/css/ionic/nodejs/bootstrap (19)
- Linux/shell/centos (56)
- cvs/svn/git/sourceTree/gradle/ant/maven/mantis/docker/Kubernetes (26)
- sonatype nexus (1)
- tomcat/jetty/netty/jboss (9)
- 工具 (17)
- ETL/SPASS/MATLAB/RapidMiner/weka/kettle/DataX/Kylin (11)
- hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie (190)
- ios/swift/android (9)
- 机器学习&算法&大数据 (18)
- Mesos是Apache下的开源分布式资源管理框架 (1)
- echarts/d3/highCharts/tableau (1)
- 行业技能图谱 (1)
- 大数据可视化 (2)
- tornado/ansible/twisted (2)
- Nagios/Cacti/Zabbix (0)
- eclipse/intellijIDEA/webstorm (5)
- cvs/svn/git/sourceTree/gradle/jira/bitbucket (4)
- jsp/jsf/flex/ZKoss (0)
- 测试技术 (2)
- splunk/flunm (2)
- 高并发/大数据量 (1)
- freemarker/vector/thymeleaf (1)
- docker/Kubernetes (2)
- dubbo/ESB/dubboX/wso2 (2)
最新评论
随着搜索技术的发展,目前已经有很多可选的站内搜索解决方案了:
一,使用百度自定义搜索
这个可以说是成本最低的,几乎不用占用服务器资源,也无需开发,草根站长首选解决方案,当然了也存在收录不全,无法进行更深度的定制和整合。
二,使用第三方开源系统
目前已经有非常多的第三方开源搜索系统,比如SOLR,LUCENE,SPHINX等,可以根据自己的需要构建站内搜索服务,而且方便进行深度定制和整合。
三,采购第三方商业解决方案
目前市面上做的比较好的商业解决方案有线点科技的全文搜索引擎和搜易软件开发的搜易站内搜索引擎,前者可以适用于多种操作系统,缺点是没有免费版放出来,价格相对较高,后者只能应用在WINDOWS系列操作系统上使用,有免费版可以使用,而且商业版也不贵,而且内置了搜索历史记录,TAG系统生成,JS/XML接口等非常适用的功能,特别适合使用WINDOWS系列操作系统的站长首选。
摘要
站内搜索引擎是搜索网站重要信息的必要工具,高效的站内搜索将有助于提升网站的价值,发挥网站应有的作用。虽然现在一些网络巨头已开始研究并应用这类工具,但整个互联网...
关键词全文检索 / 网络蜘蛛 / 中文分词 / 站内搜索引擎
搜索引擎:
1.全文索引
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
2.目录索引
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。
3.元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
其他非主流搜索引擎形式
(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
(2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
(3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
一,使用百度自定义搜索
这个可以说是成本最低的,几乎不用占用服务器资源,也无需开发,草根站长首选解决方案,当然了也存在收录不全,无法进行更深度的定制和整合。
二,使用第三方开源系统
目前已经有非常多的第三方开源搜索系统,比如SOLR,LUCENE,SPHINX等,可以根据自己的需要构建站内搜索服务,而且方便进行深度定制和整合。
三,采购第三方商业解决方案
目前市面上做的比较好的商业解决方案有线点科技的全文搜索引擎和搜易软件开发的搜易站内搜索引擎,前者可以适用于多种操作系统,缺点是没有免费版放出来,价格相对较高,后者只能应用在WINDOWS系列操作系统上使用,有免费版可以使用,而且商业版也不贵,而且内置了搜索历史记录,TAG系统生成,JS/XML接口等非常适用的功能,特别适合使用WINDOWS系列操作系统的站长首选。
摘要
站内搜索引擎是搜索网站重要信息的必要工具,高效的站内搜索将有助于提升网站的价值,发挥网站应有的作用。虽然现在一些网络巨头已开始研究并应用这类工具,但整个互联网...
关键词全文检索 / 网络蜘蛛 / 中文分词 / 站内搜索引擎
搜索引擎:
1.全文索引
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
2.目录索引
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。
3.元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
其他非主流搜索引擎形式
(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
(2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
(3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
发表评论
-
2018071904积累
2018-07-19 10:04 444https://www.imooc.com/article ... -
201806182117
2018-06-18 21:19 458https://blog.csdn.net/mosheng ... -
2018020508积累
2018-05-08 19:14 393https://blog.csdn.net/babyupup/ ... -
2018020404积累
2018-04-06 12:06 01.https://www.cnblogs.com/wxgb ... -
2018020328积累
2018-04-06 11:52 3751.https://blog.csdn.net/quinc ... -
2018020322积累
2018-03-22 10:59 0http://mysql.taobao.org/month ... -
2018020315积累
2018-03-15 23:24 0js中 a=b||0; 在这里||代 ... -
2018020308积累
2018-03-08 15:55 01.http://blog.csdn.net/liu943 ... -
2018020304积累
2018-03-04 18:37 425http://blog.csdn.net/lengcong ... -
20180228积累
2018-03-03 21:28 474https://jackywu.github.io/art ... -
20180225积累
2018-02-25 20:42 392生存发展的法则哈,管理层不想被偏门技术人员挟持,可技术人员 ... -
20180223积累
2018-02-24 09:35 377google浏览器点击链接 ... -
20180222积累2
2018-02-22 22:48 441http://www.aboutyun.com/threa ... -
异构数据源海量数据交换工具-Taobao DataX 下载和使用
2018-02-22 09:36 616DataX介绍 DataX是一个在异构的数据库/文件系统之 ... -
积累20180203
2018-02-03 13:18 328TRUNCATE TABLE 在功能上与不带 WHERE ... -
工作的常识
2018-02-01 11:19 461SN码是Serial Number的缩写,有时也叫Serial ... -
软件开发工作总结
2018-01-31 18:59 3211、分享第一条经验: ... -
war包不自动解压
2018-03-22 10:41 830war包放到了tomcat7下的webapps中不解压 , ... -
maven项目的不同
2018-01-07 15:41 01.maven的web项目和Java项目的创建 2.ecl ... -
电脑休眠和睡眠的区别
2018-01-07 08:55 593电脑休眠和睡眠的情况是不分台式和笔记本的! 休眠;就是把应用环 ...
相关推荐
搜易站内搜索引擎是面向互联网站点的站内搜索解决方案,功能强大,性能优越,可帮助大数据量和大搜索量的网站低成本解决站内搜索质量和效率问题。 应用场景: 一、单一网站的站内搜索 利用我们基于频道化模型的搜索...
搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等...
搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等...
百度站内搜索服务,即Baidu Site Search(BSS),是百度提供的一项帮助企业或个人搭建个性化站内搜索解决方案的服务。通过这个服务,开发者可以定制搜索结果的展示样式,同时获得百度强大的自然语言处理和搜索算法...
搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词...
Search Engine Builder Professional 就是这样一款专业软件,帮助开发者或网站管理员轻松创建自定义的站内搜索解决方案。 站内搜索的核心知识点包括: 1. **索引构建**:站内搜索首先需要对网站内容进行索引,这...
麦葱特制多站合一音乐搜索解决方案,支持搜索试听以下网站音乐:网易云音乐 QQ音乐 酷狗音乐 酷我音乐 虾米音乐 百度音乐 一听音乐 咪咕音乐 荔枝FM 蜻蜓FM 喜马拉雅FM 全民K歌 5sing原创 5sing翻唱
搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词...
Google作为全球知名的搜索引擎,其技术实力强大,提供的站内搜索解决方案往往具有高度的智能化和定制化,例如支持自然语言处理、相关性算法优化等特性。 在压缩包内的“search”文件,可能包含的就是这个插件的核心...
### 企业级内部信息统一搜索解决方案 #### 一、引言 随着企业信息化建设的深入发展,企业内部积累了大量的业务数据。如何有效地管理和利用这些数据成为企业关注的焦点之一。企业级内部信息统一搜索解决方案旨在解决...
总的来说,"麦布站内搜索 v2.0" 是一款可定制的站内搜索解决方案,它提供源代码,允许开发者根据自身需求进行修改和扩展。通过这个系统,网站可以提升用户体验,提供更快、更准确的搜索服务。同时,配套的文档和资源...
总之,Mysoo站内搜索 v1.0 Preview提供了完整的站内搜索解决方案,它基于Java Web技术,包含搜索引擎、索引构建器、搜索接口、用户界面等多个关键组成部分,旨在提升网站内容的可搜索性和用户体验。对于那些需要对...
搜易站内搜索引擎是面向互联网站点的站内搜索解决方案,功能强大,性能优越,可帮助大数据量和大搜索量的网站低成本解决站内搜索质量和效率问题。开发本产品是因为遇到不少网站因为搜索量大,使用普通的数据库搜索...
搜易站内搜索引擎凭借其基于Lucene.NET的架构,为.NET开发者提供了强大且便捷的站内搜索解决方案。通过对文本的高效索引和检索,它能帮助各种Web应用程序提升用户体验,使信息查找变得更为简单快捷。无论是小型项目...
搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词...
【Mysoo站内搜索 v1.0 Preview】是一款针对网站内部内容进行高效检索的解决方案。这个压缩包文件`mysoo-1.0-preview.war`是该系统的Web...通过不断的迭代和完善,开发者旨在提供一个稳定、高性能的站内搜索解决方案。
【百度站内搜索迁入独立首页 增3项新功能】 百度站内搜索,作为一项为网站提供专业搜索引擎服务的工具,...百度站内搜索团队将继续倾听站长需求,持续优化产品,致力于为更多网站提供强大而完善的站内搜索解决方案。
本篇将深入探讨如何利用Lucene.Net构建一个自定义的站内搜索解决方案。 Lucene.Net是Apache Lucene的.NET版本,它为开发人员提供了强大的文本检索库,支持创建高性能、可扩展的搜索应用。Lucene.Net主要由以下几个...
《.Net Lucene+盘古分词:打造高效站内搜索解决方案》 在现代网站和应用程序中,提供精准、快速的站内搜索功能是提升用户体验的关键。本文将深入探讨如何结合.Net框架与Lucene搜索引擎库,搭配盘古分词工具,来构建...
ElasticSearch 可扩展的开源弹性搜索解决方案