`
oycn0755
  • 浏览: 113729 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论
阅读更多

相关技术及概念:

 

lucene: 基入JAVA的开源搜索引擎

Nutch

Heritrix:爬虫框架,是IA的开放源代码,可扩展的,基于整个Web的归档网络爬虫工程

compass:一流的开放源码JAVA搜索引擎框架

Solr:是一个基于Lucene java库的企业级搜索服务器
IKAnalyzer:为lucene定做的中文分词组件

jspider:顾名思义,是一个用Java开发的爬虫。

htmlparser:是解析html页面的,因为lucene自带的html解析器不够健壮,所以用了这个。

 

 

Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servlet容器中。所以Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的建设,而Solr专注于企业应用。Lucene不负责支撑搜索服务所必须的管理,而Solr负责。所以说,一句话概括Solr: Solr是Lucene面向企业搜索应用的扩展

分享到:
评论

相关推荐

    走进搜索引擎.pdf

    梁斌毕业于南京大学,获得软件工程硕士学位,曾经发表过多篇论文,获得1项国家专利,作者主要的兴趣方向包括数据挖掘、Wed挖掘、搜索引擎和软件工程等,目前在清华大学信息科学与技术国家实验室从事搜索引擎相关研究...

    搜索引擎相关图书

    搜索引擎是信息技术领域中的一个重要组成部分,它为用户提供了高效、便捷的信息获取途径。在这个主题中,我们聚焦于几本...这不仅对个人的技术成长大有裨益,也为解决实际工作中遇到的搜索引擎相关问题打下坚实的基础。

    搜索引擎相关论文

    这篇名为“搜索引擎相关论文”的文档,很可能深入探讨了搜索引擎的工作原理、优化策略以及对用户搜索行为的理解。 搜索引擎的主要组成部分包括爬虫、索引、查询处理和排名。首先,爬虫是搜索引擎获取网页信息的先驱...

    搜猫搜索引擎源码|仿百度搜索引擎源码

    【标题】"搜猫搜索引擎源码|仿百度搜索引擎源码"揭示了这是一份与搜索引擎相关的源代码,特别提到了“搜猫”品牌,并模仿了知名的百度搜索引擎的某些功能或设计。这个源码可能是用于学习、研究或者开发自己的搜索...

    搜索引擎-传统搜索引擎与智能搜索引擎比较研究.pdf

    同时,搜索引擎的发展也推动了相关技术的发展,如网络爬虫、数据挖掘、云计算等技术。 本研究认为,搜索引擎的发展将朝着更加智能、更加人性化的方向发展,搜索引擎将更加智能地理解用户的搜索意图,并提供更加个性...

    微流搜索引擎相关关键字获取工具

    微流搜索引擎相关关键字获取工具是一种专门用于收集和分析搜索引擎关键词的软件工具。在互联网营销和SEO(搜索引擎优化)领域,了解并使用正确的关键字对于提升网站的可见性和排名至关重要。这款工具可以帮助用户...

    java搜索引擎大全.zip

    "java搜索引擎大全.zip"这个压缩包包含了一系列与Java搜索引擎相关的资源,适合开发者进行学习和毕业设计。这里我们将深入探讨其中涉及的关键知识点,包括Java搜索引擎的原理、数据库的应用以及相关工具的使用。 1....

    中文搜索引擎相关的几篇论文

    中文搜索引擎是信息技术领域的一个重要分支,它涉及到自然语言处理、信息检索、数据挖掘等多个方面的知识。以下是对压缩包中论文标题和描述所涵盖的关键知识点的详细解析: 1. **智能中文搜索引擎若干关键技术的...

    知识图谱和搜索引擎相关文章介绍 (pdf\caj 博客资料)

    该资源主要是结合我的博客 搜索引擎和知识图谱那些事 (上).基础篇的相关引用资料,博客地址:http://blog.csdn.net/eastmount/article/details/46874155 主要包括: 1.搜索引擎主要参考张俊林的书籍《这就是搜索...

    搜索引擎技术分析.doc

    综上所述,《搜索引擎技术分析.doc》文档涵盖了搜索引擎从数据获取、索引构建、查询处理到优化的全过程,对于想要深入了解和从事搜索引擎相关工作的人来说,是一份非常有价值的学习资料。通过深入学习,我们可以更好...

    国外搜索引擎大全!!!

    3. **语言和地域限制**:针对不同国家的搜索引擎,可以设定语言和地域偏好,获取更相关的搜索结果。 4. **使用引号**:用引号将短语括起来,搜索引擎会将该短语视为一个整体,返回精确匹配的结果。 5. **了解搜索...

    [搜索链接]无极搜索引擎 v1.0_gss.zip

    这个压缩包包含了该搜索引擎的核心组件和相关文档,为用户提供了全面了解和使用无极搜索引擎的资源。 在搜索引擎领域,无极搜索引擎v1.0可能采用了以下关键技术: 1. **爬虫技术**:搜索引擎的第一步是收集互联网...

    这就是搜索引擎-核心技术详解.pdf

    总的来说,《这就是搜索引擎-核心技术详解》是一本全面介绍搜索引擎工作原理和技术实现的电子书籍,它不仅对搜索引擎的关键技术进行了深入的剖析,还可能涉及到了与搜索引擎相关的网络资源分享和网络安全等方面的...

    国外搜索引擎

    6. **个性化搜索**:通过用户的搜索行为和偏好,搜索引擎可以提供个性化的搜索结果,这包括地理位置相关的搜索、历史搜索记录的关联推荐等。 7. **搜索优化**(SEO):对于网站所有者,理解并优化网站以适应国外...

    搜索引擎源代码中国搜搜索引擎

    搜索引擎是互联网上用于查找信息的核心技术,其核心在于通过复杂的算法和数据处理,为用户提供最相关、最准确的搜索结果。"中国搜搜索引擎"是针对中文用户设计的一种搜索引擎,旨在提供高效、精准的中文搜索服务。在...

    一本讲搜索引擎原理的书

    ### 搜索引擎原理、技术...综上所述,《搜索引擎:原理、技术与系统》是一本全面介绍搜索引擎相关知识的优秀书籍,无论是在理论层面还是实践层面上都极具价值。无论是对于学生还是专业人员来说,阅读本书都将大有裨益。

Global site tag (gtag.js) - Google Analytics