`
whoisjackychen
  • 浏览: 13192 次
文章分类
社区版块
存档分类
最新评论

开源搜索引擎

阅读更多

开源搜索引擎,或者准确的说开源爬虫系统,目前有nutch和heritrix等,nutch基于hadoop架构,分为1.x和2.x分支。nutch目前用得相对比较多一些。

分享到:
评论

相关推荐

    (C#开源搜索引擎).rar

    标题中的"(C#开源搜索引擎).rar"表明这是一个与C#编程语言相关的开源搜索引擎项目。开源意味着源代码可供公众查看、使用、修改和分发。这个压缩包可能包含了一个完整的搜索引擎解决方案,供开发者学习、研究或者在...

    Java开源搜索引擎分类列表.rar

    Java开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava开源搜索引擎分类列表.rarJava...

    c# 开源搜索引擎完整的例子

    本主题聚焦于一个特别的应用场景——"c# 开源搜索引擎",这是一个利用C#构建的开源搜索引擎项目,提供了完整的源代码供学习和参考。 搜索引擎的核心功能包括数据收集(爬虫)、索引构建、查询处理和结果展示。以下...

    开源搜索引擎,solr

    建立索引,检索,分词,分类,开源搜索引擎,solr

    基于lucene和nutch的开源搜索引擎资料集合

    其中内容均为前段时间研究开源搜索引擎时搜集参考的资料,非常齐全包含的内容有: Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索...

    国内首例开源搜索引擎分词

    《国内首例开源搜索引擎分词:云寻觅的探索与实践》 在信息化时代,搜索引擎作为获取信息的重要工具,其核心之一就是分词技术。分词是自然语言处理中的基础步骤,它将连续的文本流分割成具有独立意义的词语,从而为...

    一个C#写的开源搜索引擎代码

    《C#实现的开源搜索引擎深度解析》 在IT领域,搜索引擎是信息检索的重要工具,而C#作为.NET框架下的主流编程语言,也被广泛应用于各种软件开发,包括搜索引擎的实现。本篇文章将深入探讨一个基于C#编写的开源搜索...

    迅龙中文Web搜索引擎(.NET)-开源的搜索引擎程序C#编写

    迅龙中文Web搜索引擎是一款由C#编程语言编写的开源搜索引擎程序,它为开发者提供了一种高效、易用的方式来实现中文网页的索引与检索功能。这款软件的核心在于其强大的文本处理和搜索算法,能够有效地处理中文分词和...

    PHP实例开发源码-开源搜索引擎整合系统 Seeknove.zip

    PHP实例开发源码—开源搜索引擎整合系统 Seeknove.zip PHP实例开发源码—开源搜索引擎整合系统 Seeknove.zip PHP实例开发源码—开源搜索引擎整合系统 Seeknove.zip

    迅速搭建全文搜索平台——开源搜索引擎实战教程--代码.rar

    在本教程中,我们将深入探讨如何利用开源搜索引擎技术快速构建一个全文搜索平台。开源搜索引擎以其灵活性、可扩展性和成本效益,已经成为许多企业和开发者构建高效检索系统的首选方案。本实战教程将带你一步步实现这...

    开源搜索引擎sphider

    开源搜索引擎Sphider是一款专为小型到中型网站设计的搜索引擎解决方案,由PHP编写,以MySQL作为后端数据库。它的核心优势在于其轻量级、高效且易于部署和定制,使得许多不懂复杂编程的网站管理员也能为其网站添加...

    PHP开发的开源搜索引擎整合系统

    **PHP开发的开源搜索引擎整合系统——Seeknove 1.0.15详解** Seeknove 1.0.15是一款基于PHP编程语言构建的开源搜索引擎整合平台,它的主要功能是集中展示并提供来自多个搜索引擎的搜索结果,让用户能够在一个界面下...

    zettair C开源搜索引擎

    Zettair是一款用C语言编写的开源搜索引擎,它提供了对文本、图像以及二进制文件的全面索引和检索能力。作为一个轻量级且高效的搜索解决方案,Zettair适用于各种场景,包括小型到中型的数据集,尤其适合那些对资源...

    Nutch开源搜索引擎增量索引recrawl的终极解决办法

    ### Nutch开源搜索引擎增量索引recrawl的终极解决办法 #### 知识点解析: **Nutch与Hadoop集成下的recrawl策略** Nutch是一款基于Java的开源搜索引擎框架,能够爬取网页、提取数据并建立索引。它利用Apache ...

    《迅速搭建全文搜索平台—开源搜索引擎实战教程》作者于天恩—代码

    在本教程中,作者于天恩提供了关于如何迅速搭建全文搜索平台的开源搜索引擎实战指导。全文搜索平台是一种高效的信息检索系统,它允许用户通过输入关键词快速查找相关文档或数据。开源搜索引擎由于其开放性、可定制性...

    C++开源搜索引擎xapian开发入门demo

    C++开源搜索引擎Xapian是一个高效、可扩展的库,专为全文搜索和信息检索设计。本篇将介绍如何入门Xapian的开发,带你了解其核心概念、安装过程、基本用法以及如何通过C++接口进行操作。 首先,Xapian的核心特性包括...

    基于PHP的Yioopphp开源搜索引擎系统源码.zip

    "基于PHP的Yioopphp开源搜索引擎系统源码.zip" 这个标题揭示了我们讨论的主题是一个使用PHP编程语言开发的开源搜索引擎系统。Yioopphp是这个系统的名称,它是一个用于创建自定义搜索引擎的平台,允许用户抓取、索引...

    基于PHP的开源搜索引擎整合系统 Seeknove.zip

    Seeknove是一个基于PHP开发的开源搜索引擎整合系统,它的设计目标是帮助用户更方便地集成和管理多种不同的搜索引擎,提供一站式的搜索解决方案。这个系统允许开发者或者网站管理员将多个搜索引擎如Google、Bing、...

Global site tag (gtag.js) - Google Analytics