`
com1com4
  • 浏览: 162304 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Coreseek简介

阅读更多

3.2.13基于Sphinx 0.9.9 release开发,全面支持:
Freebsd 6、7、8
Redhat、CentOS、Fedora、 Debian、Ubuntu、Gentoo、OpenSUSE、Slackware、ArchLinux
WindowsXP、 Windows2003、Windows7等各类32位以及64位操作系统

 

  1. 支持多种数据来源
    • Mysql数据库
      支持多种MySQL文本数据的中文编码格式,目前支持的有UTF-8、GB18030;
    • PostgreSQL数据库
    • xmlpipe2 数据管道
      允许用户通过xmlpip2向全文搜索服务器导入自定义格式的数据。
    • Python 可编程数据源
  2. 高性能
    • 高速索引
      在现代CPU上可达10 MB/秒(英文),在启用了中文分词后,建立索引的速度可达300K/s;
    • 高速搜索
      在2-4 GB的文本建立的索引上搜索,平均0.1秒内获得结果;
    • 可处理大数据量
      在单一CPU上,实测最高可对100GB的文本建立索引,单一索引可包括100M文件 
    • 支 持分布式搜索
      支持主从式的分布式搜索,支持单一节点失效不影响整个搜索系统
  3. 支持复杂的查询
    • 支持基于短语和基于统计的复合结果排序机制
    • 支持任意数量的文件字段(数值或全文文本)
    • 支持不同的搜索模式( “完全匹配” , “短语匹配”和“任一匹配” )
  4. 为中文优化
    • 基于最大匹配算法的中文分词模块
    • 支持GB18030、UTF-8等多种编码的数据源
    • 针对中文的具体特点,对结果的排序进行了优化
  5. 支持作为MySQL的存储引擎
分享到:
评论

相关推荐

    coreseek搜索服务1

    1. **CoreSeek简介**:CoreSeek的起源、特点、适用场景和主要功能,包括它的多语言支持、实时索引和查询性能。 2. **安装与配置**:讲解如何在不同操作系统(如Linux)上安装CoreSeek,配置其核心参数,如数据源...

    coreseek的demo 20141224修改

    一、CoreSeek简介 CoreSeek是中国开发的一款开源全文搜索服务器,它提供了丰富的中文分词支持,兼容Sphinx的API,使得开发者可以轻松地集成到现有系统中。CoreSeek的出现,极大地简化了中文网站和应用的全文搜索功能...

    coreseek-4.1-win32

    CoreSeek简介** CoreSeek是基于Sphinx搜索引擎的中文版,主要由上海搜狗信息技术有限公司开发。它集成了MMseg中文分词算法,提高了对中文文本处理的准确性。CoreSeek支持SQL Server、MySQL等多种数据库,可以与现有...

    coreseek-3.2.14-win32

    1. **CoreSeek简介** CoreSeek是基于Sphinx搜索引擎开发的,它支持多国语言,包括中文,具备高效、快速、稳定的特点。它不仅提供了全文索引和搜索功能,还集成了SQL全文检索接口,使得用户可以方便地将数据库与搜索...

    公司sphinx搜索学习ppt

    #### 一、Sphinx与Coreseek简介 - **Sphinx** 是一款高性能、基于SQL的全文检索引擎,它能够快速地在海量文本数据中进行搜索,并返回相关的搜索结果。Sphinx支持多种数据库后端,如MySQL、PostgreSQL等,并且可以...

    sphinx/coreseek权威手册中文版

    1. 简介 - Sphinx/Coreseek 是一款高性能、全文检索引擎,它能够快速地提供精确的搜索结果。Coreseek在Sphinx的基础上增加了对中文的支持和优化,使得在海量文本数据中进行中文搜索变得高效且便捷。 - 特性包括:...

    sphinx 中英文分词检索介绍

    1. **Coreseek简介**:Coreseek是基于Sphinx开发的一个中文全文检索解决方案,专门针对中文环境进行了优化,提供了更优秀的中文分词支持。 2. **安装步骤**: - **下载安装包**:访问Coreseek官网下载最新的稳定...

    coreseek在windows和linux下的使用.docx

    #### 一、Sphinx简介及其重要性 **Sphinx** 是一款高性能的全文检索引擎,适用于处理大规模文本数据的搜索需求。随着互联网的发展,越来越多的应用需要处理海量数据的实时搜索问题,如论坛、博客等。当数据量达到...

    Sphinx 0.9.9/Coreseek 3.2 参考手册

    1. **简介** - **Sphinx/Coreseek是什么**:Sphinx是为高速、高精度的全文搜索设计的搜索引擎,Coreseek则是其针对中文处理的衍生版本,提供了更好的中文分词和搜索体验。 - **特性**:包括高效的数据索引、实时...

    Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册

    1. **简介** - **Sphinx** 是一个高性能的全文搜索引擎,它被设计为数据库的后端,用于提供快速的全文检索服务。 - 特性包括实时索引更新、分布式搜索、多种数据源支持等,适用于大量文本数据的检索场景。 2. **...

    PHP+Mysql+Sphinx高效的站内搜索引擎搭建详释.docx

    #### 三、Sphinx简介 Sphinx是一款由俄罗斯开发者Andrew Aksyonoff开发的高性能全文搜索软件包。它支持GPL和商业双重许可模式。全文检索技术是指通过对文档中的所有文本信息进行检索来实现信息查找的技术。它可以...

    sphinx+php检索引擎

    #### 二、Sphinx简介 Sphinx是由俄罗斯开发者Andrew Aksyonoff开发的高性能全文搜索软件包,该软件同时支持GPL和商业许可协议。全文检索是一种以文档的全部文本信息作为检索对象的信息检索技术。检索对象可能包括但...

    使用PHP+Sphinx建立高效的站内搜索引擎

    #### 二、Sphinx简介 Sphinx是一款由俄罗斯开发者Andrew Aksyonoff创建的高性能全文搜索软件包,它支持多种操作系统,并提供了丰富的功能和高度的定制能力。Sphinx采用了GPL与商业许可双许可模式,允许开发者根据...

    sql全文索引 sphinx

    1. **Sphinx简介** Sphinx是一个独立的搜索引擎,它设计用于快速、准确地提供信息检索服务。Sphinx支持多种数据库系统,如MySQL、PostgreSQL等,并且提供了一个API供开发者进行二次开发。Sphinx的核心特性包括实时...

    sphinx 参考手册和源程序

    Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册和源程序 手册內容: 文档版本:v0.9 目录 1. 简介 1.1. 什么是 Sphinx 1.2. Sphinx 的特性 1.3. 如何获得 Sphinx 1.4. 许可协议 1.5. 作者和贡献者 1.6. ...

    MySQL的索引详解

    - **简介**:在MySQL中,索引是一种特殊的数据结构,它允许数据库快速定位并访问表中的特定记录。索引被称为“键”,对于性能优化至关重要,特别是在处理大量数据时。创建和选择合适的索引是提升查询效率的关键步骤...

Global site tag (gtag.js) - Google Analytics