`
ljl_xyf
  • 浏览: 634598 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Coreseek开源中文检索引擎Sphinx中文版

阅读更多

Sphinx Search 是由俄罗斯人Andrew Aksyonoff 开发的高性能全文搜索软件包,在GPL与商业协议双许可协议下发行。
Sphinx支持从多种数据源获取待检索的数据,目前包括:

 

  • MySQL数据库
  • PostgreSQL数据库
  • XML数据管道,允许索引其他用户自定义格式

 

Sphinx的主要功能包括:

  • 高速建立索引(可达10 MB/秒)
  • 高性能搜索(在2-4 GB的文本上搜索,平均0.1秒内获得结果)
  • 高扩展性(在单一CPU上,实测可对100GB的文本建立索引,单一索引可包括100M文件 )
  • 支持分布式检索
  • 支持基于短语和基于统计的复合结果排序机制
  • 支持任意数量的文件字段(数值属性或全文检索属性)
  • 支持不同的搜索模式( “完全匹配” , “短语匹配”和“任一匹配” )
  • 支持作为Mysql的存储引擎

Coreseek 在Sphinx的基础上,对Sphinx 的中文支持进行增强,包括:

  • 使用Python的可编程数据源
  • 基于最大匹配算法的中文分词模块
  • 支持GB18030编码的数据源

下载:

  • 基于复合最大匹配算法的中文分词法 libmmseg 。该分词库在GPL协议下授权发布。

目前,Coreseek 不单独提供补丁文件,有在Sphinx中启用中文分词的用户,请直接下载 Coreseek 全文检索服务器。

分享到:
评论

相关推荐

    coreseek(sphinx + 中文分词)

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    Sphinx 0.9.9-Coreseek 3.2 参考手册.chm

    Sphinx 0.9.9/Coreseek 3.2 参考手册 离线版 Sphinx--强大的开源全文检索引擎,Coreseek--免费开源的中文全文检索引擎 在线地址: http://www.coreseek.cn/docs/coreseek_3.2-sphinx_0.9.9.html

    sphinx+coreseek安装配置

    CoreSeek是基于Sphinx的中文分词和全文检索引擎,提供了中文支持和更丰富的功能。它包含了mmseg中文分词算法,能够更好地处理中文的搜索需求。 ### 3. 安装Sphinx 首先,确保系统已安装必要的依赖项,如`libxml2`...

    最新版sphinx coreseek 4.1 win32

    它结合了Sphinx搜索引擎的强大性能和CoreSeek的中文处理能力,使得在中文环境下进行信息检索变得更为便捷。 Sphinx是一个开源全文搜索引擎,它拥有快速的索引速度和低内存占用,支持实时索引和多种数据源。CoreSeek...

    sphinx mmseg coreseek 搜狗 词库

    在IT领域,Sphinx、MMSEG、CoreSeek和搜狗词库是四个与搜索引擎和文本处理相关的技术。这里,我们将详细探讨这些技术及其在实际应用中的作用。 首先,Sphinx是一个开源全文搜索引擎,广泛用于网站后台,提供高效、...

    coreseek的demo 20141224修改

    CoreSeek是一款基于Sphinx搜索引擎的开源全文检索解决方案,它在中国的开源社区中有着广泛的应用。本教程将深入探讨2014年12月24日版本的CoreSeek demo,以及与其密切相关的Sphinx搜索引擎的核心概念和技术。 一、...

    coreseek SPHINX 使用说明及详细介绍

    Coreseek Sphinx是一款基于全文搜索引擎的开源软件,它提供了高效、精准的搜索功能,常用于大数据量的网站或应用。Sphinx是由俄罗斯的Andrew Aksyonoff开发,而Coreseek是Sphinx在中国的一个分支,增加了对中文的...

    wordpress使用coreseek(sphinx)全文索引

    wordpress的默认搜索是采用mysql的like,但是当我们整个网站的数据非常大的时候...Coreseek开源中文检索引擎,可以说是Sphinx中文版,因为coreseek加入了中文分词库,大家可以到官网去查看具体介绍:http://www.corese

    coreseek-3.2.14.zip

    CoreSeek是一款基于Sphinx搜索引擎的开源全文搜索解决方案,主要用于提供高效、精确的全文检索功能。在这款软件的3.2.14版本中,我们能够深入探讨关于Sphinx搜索引擎、CoreSeek的特点以及如何在项目中应用这些技术。...

    coreseek-4.1.zip windows版

    Coreseek是一款开源的全文搜索引擎系统,它主要针对中文环境,为用户提供高效、精确的全文检索功能。这个"coreseek-4.1.zip windows版"是Coreseek的Windows平台版本,适用于那些在Windows操作系统上构建搜索服务的...

    Coreseek 全文搜索服务器2.5

    **Coreseek 全文搜索服务器2.5**是一款基于开源全文搜索引擎Sphinx进行修改和增强的产品,它在原生Sphinx的基础上提供了更多的功能和优化,旨在为企业和开发者提供更高效、更灵活的全文检索解决方案。在GPL协议下,...

    sphinx全文搜索引擎

    Sphinx全文搜索引擎是一款高效、可定制的开源全文检索引擎,主要设计用于网站后台提供快速、准确的全文搜索功能。它最初由俄罗斯开发者Andrew Aksyonoff开发,现在已经成为许多大型网站和应用程序的重要组成部分,...

    coreseek4.1.zip

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    coreseek41-windows.zip

    CoreSeek41-Windows是一个专为Windows平台设计的全文搜索引擎软件包,主要包含了Sphinx技术,用于高效、精准地处理中文分词和全文检索。Sphinx是一款开源的、高性能的全文检索引擎,最初由俄罗斯开发者开发,现在...

    基于Coreseek+Python的分布式全文检索方法.pdf

    2. **Coreseek全文检索引擎**:Coreseek是一个开源的全文检索解决方案,它基于Sphinx搜索引擎,具有高速度和易于扩展的特点。它通常用于构建高性能的全文检索系统。 3. **Python**:Python是一种广泛使用的高级编程...

    Sphinx-完整中文手册

    Sphinx是一款强大的开源全文检索引擎,而Coreseek是基于Sphinx的免费开源中文全文检索引擎。这两个引擎的主要用途是帮助用户快速地从大量文本数据中找到所需的特定信息。它们为用户提供了丰富的检索功能,例如支持...

    浅谈Coreseek、Sphinx-for-chinaese、Sphinx+Scws的区别

    在IT领域,全文检索引擎是实现高效数据搜索的关键技术,Sphinx作为一个强大的开源全文检索引擎,被广泛应用在网站和各种信息检索系统中。然而,由于Sphinx原生并不支持中文,因此在处理中文数据时需要借助额外的工具...

    coreseek-4.1中文全文检索/搜索软件

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    coreseek-3.2.13.tar.gz

    Coreseek是一款基于Sphinx搜索引擎技术的中文全文检索引擎软件,主要应用于大数据量的全文搜索解决方案。这个"coreseek-3.2.13.tar.gz"文件是一个Linux/Unix平台下的压缩包,包含了Coreseek 3.2.13版本的所有源代码...

Global site tag (gtag.js) - Google Analytics