阅读更多

4顶
0踩

开源软件

原创新闻 YaCy 1.0发布,开源的分布式搜索引擎

2011-11-29 12:45 by 副主编 wangguo 评论(6) 有6854人浏览
经过了5年的开发,YaCy团队发布了这个开源的、分布式搜索引擎的1.0版本。该版本基于GPL许可,被设计用来替代目前的一些由一家公司集中托管的搜索服务,如Google等。



YaCy是基于P2P的Web搜索引擎系统,使用Java,其核心是分布在数百台计算机上的被称为YaCy-peer的计算机程序,基于P2P网络构成了YaCy网络,整个网络是一个分散的架构,所有的peer处于对等的地位,没有统一的中心服务器,每个peer独立地进行互联网的抓取、分析及建立索引库,并通过P2P网络进行共享;而且每个peer又都是一个独立的代理服务器,能够对本机使用的网页进行索引,采用多种机制保护用户的隐私,也通过本机运行的Web服务器进行查询和返回结果。

Karsten Gerloff(欧洲自由软件基金会主 席)形容YaCy项目为“未来分布式世界、点对点系统中的一个重要的组成部分”。

目前,超过600个peer的经营者已经加入到基于YaCy的分布式网络搜索中,该搜索引擎当前已经在索引中提供了14亿份文档,每天处理13万搜索请求。科学搜索引擎Sciencenet也是基于YaCy技术。

另外,YaCy开发团队强调,无论作为独立安装(例如用于局域网中的本地搜索)还是作为点对点系统中的一个peer,YaCy的安装都非常简单,只需几分钟。

测试页面:http://search.yacy.net/

下载地址:

  • 大小: 164.6 KB
4
0
评论 共 6 条 请登录后发表评论
6 楼 z276356445t 2011-11-30 10:16
这个应该顶,至少搜索概念上是创新的.
不知道这个东西效率怎么样
5 楼 kingapex 2011-11-30 10:09
搜索sex试试
4 楼 zhzhenqin 2011-11-30 09:34
用了关键字Java试了一下,两分钟都没出结果.
3 楼 counters15 2011-11-30 09:31
开源吗?没看到源代码下载啊?
2 楼 tron.lu 2011-11-30 08:58
不支持中文搜索,不是翻译 - -
1 楼 tron.lu 2011-11-30 08:57

不支持中文翻译。

最大特色可能是P2P网络架构了 - -

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • YaCy—基于P2P的分布式开源搜索引擎

    经过了长达5年的开发,YaCy团队于2011年11月发布了这个开源的、分布式搜索引擎的1.0版本。该版本基于GPL许可,被设计用来替代目前的一些由一家公司集中托管的传统搜索服务,如Google等。 其核心是分布在数百台...

  • java开源搜索引擎分类

    1、Egothor Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 2、Nutch Nutch 是一...

  • Java开源搜索引擎

    EgothorEgothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。更多Egothor信息NutchNutch是...

  • java开源搜索引擎开源分类列表

    Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 更多Egothor信息 Nutch ...

  • 一系列开源浏览器(Open source browser)介绍

    本文介绍一些主流开源浏览器(Open source browser)框架,只统计还在更新的开源浏览器,比较出名的有Chromium,Mozilla Firefox、Brave、GNOME Web等等,帮助大家方便选择什么浏览器进行GUI开发。有些浏览器对系统...

  • 搜索引擎

    Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。 点击进入详细页面 ...

  • 83款 网络爬虫开源软件

    1、http://www.oschina.net/project/tag/64/spider?lang=0&os=0&sort=view& 搜索引擎 Nutch Nutch是一个开源Java实现的搜索...

  • 44款Java 网络爬虫开源软件

    goodcrawler(GC) 网络爬虫 GC是一个垂直领域的爬虫,同时也是一个拆箱即用的搜索引擎。 GC基于httpclient、htmlunit、jsoup、elasticsearch。 GC的特点: 1、具有DSL特性的模板。 2、分布式、可扩展。 3、辛亏有...

  • 开源爬虫汇总表,83款 网络爬虫开源软件

    虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎。 开源爬虫汇总表 开发语言 ...

  • 爬虫_83款 网络爬虫开源软件

     搜索引擎 NutchNutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. ...

  • 技术运维-机房巡检表及巡检说明

    技术运维-机房巡检表及巡检说明

  • 第四次算法分析与设计整理

    第四次算法分析与设计整理

  • 图像处理_U2Net_优化模型大小_工程化部署方案_1741785598.zip

    图像处理项目实战

  • jaxlib-0.4.18-cp311-cp311-macosx_11_0_arm64.whl

    该资源为jaxlib-0.4.18-cp311-cp311-macosx_11_0_arm64.whl,欢迎下载使用哦!

  • 视频点播系统完美版源码前后端分离开源版.zip

    搭建说明. 运行环境 php5.6 mysql5.6 扩展sg11 前置条件: 前后端分离,需要准备两个域名,一个后台域名,一个前端域名 后端源码修改(cs2.ijiuwu.com批量替换改为你的后端域名)数据库修改(cs3.ijiuwu.com批量替换为你的前端域名)1、创建后台站点,上传后台源码并解压到根目录2、创建前端站点,上传前端源码并解压到根目录 3、创建数据库上传并导入数据库文件 4、修改数据库信息: 后台:app/database.php 前端:application/database.php 前端站点设置 伪静态thinkphp 运行目录public 关闭防跨站 访问后台域名/admin.php进入后台管理 admin 123456 系统-》系统设置-》附件设置-》Web服务器URL 改为你的前端域名 系统-》清前台缓存 改为你的前端域名 点击刷新缓存

  • 毕业答辩爆款黑板风教育文艺毕业论文答辩通用模板.pptx

    【毕业答辩】爆款黑板风教育文艺毕业论文答辩通用模板.pptx

  • systemd-devel-219-78.el7-9.9.x64-86.rpm.tar.gz

    1、文件内容:systemd-devel-219-78.el7_9.9.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/systemd-devel-219-78.el7_9.9.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、更多资源/技术支持:公众号禅静编程坊

  • win32汇编环境,对 WM-MOUSEMOVE 消息的理解

    win32汇编环境,对 WM-MOUSEMOVE 消息的理解

  • 车牌识别_颜色先验知识_多尺度模板匹配_身份识别脚本_1741775928.zip

    车牌识别项目

  • DDTools-master

    UE项目开发过程中的一些快捷脚本

Global site tag (gtag.js) - Google Analytics