`
hardy136
  • 浏览: 12096 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

xunsearch (基于 xapian 和 scws开源中文搜索引擎,高扛压不再死锁)

 
阅读更多

帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验

 

高性能

后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存),参见 Scalability

 

简单应用

前端是使用脚本语言编写的开发工具 (SDK),目前支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。

 

全功能

除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能,详见功能特色

分享到:
评论
1 楼 hardy136 2013-06-14  

相关推荐

    xunsearch:免费开源的中文搜索引擎,采用CC ++编写(基于xapian和scws),提供PHP的开发接口和丰富的文档

    Xunsearch的自述文件$ Id $概述Xunsearch(中文名称:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且功能强大,性能卓越能轻松处理海量数据的全文检索。它包含索引,搜索服务程序和前端脚本和脚本...

    免费开源的中文搜索引擎,采用 CC 编写 基于 xapian.zip

    免费开源的中文搜索引擎,采用 CC 编写 基于 xapian

    Xunsearch 免费开源的专业全文检索解决方案

    高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存),参见 Scalability。 简单易用:...

    基于Xapian和PHP的高性能站内搜索系统方案设计.pdf

    本文基于开源搜索引擎库Xapian,提出了一种站内搜索引擎的设计方案,并且使用PHP实现。经实际部署和应用后,该系统在性能、速度、检索精度等方面都取得了较好的表现。 一、信息检索的介绍 信息检索(Information ...

    细细品味架构·基于Xapian的垂直搜索引擎的构建分析(第2期)

    1.2.4 垂直搜索技术和业务细节 1.2.5 现场答疑【Q&A】 2、知识扩展 2.1 淘宝类目及标题相关性分档计算方法 2.1.1 系统预测该关键词所对应的优先展示类目 2.1.2 已召回宝贝进行该关键词与标题的相关性进行计算 2.2 ...

    开源的搜索引擎工具包和web搜索引擎系统 - austin lius fashion - 博客园.docx

    开源的搜索引擎工具包和Web搜索引擎系统为开发者提供了构建高效、自定义化的搜索解决方案的基础。本文将介绍几个知名的开源项目,包括Lucene、LIUS、Egothor和Xapian。 1. **Lucene** Lucene是由Apache基金会维护...

    基于xapian搜索引擎的设计

    以13 年第一季度的新浪新闻为检索目标,自行设计文档解析程序、调用xapian 建索引并实现一般检索、以及一个特殊的修饰符搜索功能(如url 搜索、标题搜索、时间搜索等),程序运行即查询过程采用web 界面和名命令行...

    C++开源搜索引擎xapian开发入门demo

    总之,Xapian是一个强大且灵活的开源搜索引擎,适合对性能和可扩展性有高要求的项目。掌握其C++ API,你将能够构建出高效的全文搜索引擎,满足各种信息检索需求。在实践中不断探索和学习,你将深入理解Xapian的工作...

    cpp-Xapiand一个基于Xapian的RESTful搜索引擎

    **Xapiand** 是一个基于 **Xapian** 库构建的现代、快速且易于使用的 RESTful 搜索引擎。这个项目旨在提供一个轻量级、高效且高度可配置的解决方案,用于索引和搜索大量数据。它允许通过 HTTP 接口与服务器进行交互...

    开源的搜索引擎工具包和web搜索引擎系统 - austin lius fashion - 博客园.pdf

    《开源的搜索引擎工具包和Web搜索引擎系统》这篇文章探讨了几个主要的开源搜索引擎工具包,它们在互联网信息检索领域扮演着重要角色。以下是这些工具包的详细介绍: 1. Lucene:由Doug Cutting创建的Lucene是Apache...

    基于Xapian站内检索的设计与实现

    Xapian作为一种基于概率模型的全文搜索引擎库,不仅提供了强大的检索功能,还具有高度的灵活性和扩展性。通过对文档进行细致的索引和利用概率理论计算相关性,Xapian能够有效地支持各种站内检索需求,是实现高质量...

    搜索引擎技术教程 网络搜索引擎原理-第7章 Xapian简介 共39页.pptx

    - Solr 是基于Lucene的开源搜索引擎平台,提供了更多的高级功能和企业级支持。 - Xapian 在某些方面比Lucene/Solr更具优势,特别是在嵌入式应用和对性能要求较高的场景下。 - **与Sphinx对比**: - Sphinx 是一...

    zettair C开源搜索引擎

    Zettair相对于其他开源搜索引擎(如Apache Lucene、Xapian等)可能在功能和社区支持上稍显不足,但它的轻量级特性使得它在特定场景下具有优势。Lucene提供更丰富的特性,如实时索引和更复杂的分析器,而Xapian则在...

    xapian_doxygen_win

    Xapian是一个强大的开源全文搜索引擎库,专为高效的信息检索设计。它由C++编写,提供了丰富的API供开发者在各种应用程序中集成全文搜索功能。Xapian的核心特性包括高效的倒排索引、多字段搜索、模糊匹配、同义词支持...

    开源搜索网站开源搜索网站

    开源搜索网站是基于开放源代码技术构建的搜索引擎,它们允许用户访问、查看、修改和贡献其源代码,促进了技术的共享与创新。开源搜索引擎通常由全球开发者社区共同维护,为用户提供自定义、可扩展和高度可配置的搜索...

    搜索引擎技术教程 网络搜索引擎原理 全部PPT课件教程 共7个章节.rar

    搜索引擎技术教程 网络搜索引擎原理-第4章 相似性和聚类 共103页 搜索引擎技术教程 网络搜索引擎原理-第5章 网络图&链接分析 共52页 搜索引擎技术教程 网络搜索引擎原理-第6章 协同过滤 共68页 搜索引擎技术教程 ...

    xapian的使用

    Xapian是一个强大的开源搜索引擎库,它被广泛用于全文搜索、文档检索以及相似度计算等任务。本教程将深入探讨如何使用Xapian,并通过一个实际的“writedatabase”示例帮助你理解其核心概念和操作流程。 首先,我们...

    PHP搜索引擎

    此外,对于Web开发者来说,理解搜索引擎优化(SEO)也是十分重要的,这涉及到如何让网站内容更容易被搜索引擎发现和理解,从而提高网站在搜索结果中的排名。这包括合理的网页结构设计、关键词策略、元标签使用、网站...

    python xapian 简单应用

    Xapian是一个高性能、可扩展的全文搜索引擎库,支持多种编程语言,包括Python。在这个应用中,我们将探讨如何利用Python接口(`python-xapian`)来实现对文件系统的目录进行索引和搜索。 首先,我们需要了解Xapian...

Global site tag (gtag.js) - Google Analytics