阅读更多
项目名称: Coreseek
发起时间: 2007年7月
网站:http://www.coreseek.com

项目介绍:
为应用提供全文检索功能,目前的版本(2.x 3.x)基于Sphinx 0.9.8,支持使用Python定义数据源,支持中文分词。
为您的应用实施全文检索,您可以:
* 帮助用户找到您业务中,目前通过全网搜索找不到的80%的信息;
* 可以保证自己信息的私密性,这在公司组织中尤其重要;
* 降低服务器的运行负载,提高系统响应速度,从而大幅度降低您的运营成本;
* 为您的需求修改检索结果的展现方式,更好的组织数据;
* 帮助您发现用户提交的敏感文档或广告。

产品信息:
开发语言: C/C++/Python
运行平台: Windows / Linux / FreeBSD
开源协议: GPL

项目成员:
李沫南 系统架构师 北京

是什么促使你们发起/开始这个项目?
搜索的技术不单会改变互联网的生态环境,也会改变软件开发与设计的方方面面,而这些方面的需求,google和百度这样的第三方搜索引擎是无法满足的。全文检索,应该是新一代应用系统的标配功能。

该项目面向哪些使用群体?
需要全文检索功能的应用开发者或网站的站长

您认为有多少人使用这个软件/项目/服务?
大约有30个项目和网站在使用这个软件

您在该项目中遇到的最大挑战是什么?
中文切分的歧义的处理与存储,目前仍未真正意义上解决。
例如,连续剧 创世纪 的切分方式 取决于 上下文, 如为圣经上的章节,应为 创世/v 纪/nv ; 如为剧集的名称,应为 创/v 世纪/nz

您对该项目有哪些期望?
希望我的软件运行在中国每个网站的后面,为浏览者提供服务。

如果您能对项目进行修改,您会改善哪些地方?
1、我们目前在设计新的中文粗切分方法,将集成NER与词性标注;如果有机会,将改进切分性能(CUDA maybe)。
2、索引器应该能够接受一句话有多种切分方案,以及多级索引
3、正向索引、文本聚类

你们一般花多长时间在这个项目上?
大约10小时/周

你们用的开发环境是什么
OS: Windows/FreeBSD
IDE: VC 2005 Express/GCC

项目里程碑
07.07 v1.0 支持Python 作为数据源,闭源软件
08.04 v2.0 改为基于Sphinx + LibMMseg ,支持Python数据源 GPL
08.08 v3.0b2 基于Sphinx 0.9.8 支持基于词典

其他人如何给你们提供建议?
论坛 http://www.coreseek.com/forum/
6
0
评论 共 1 条 请登录后发表评论
1 楼 simonli 2008-09-08 08:58
强烈支持,看来Python要火了

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • CoreseekDocker:Coreseek 中文全文检索服务的 Dockerfile

    Coreseek DockerfileCoreseek 是一款中文全文检索/搜索软件,以 GPLv2 许可协议开源发布,基于 Sphinx 研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献...

  • 用C#创建Windows(NT)服务

                                 用C#创建Windows(NT)服务    青苹果工作室 2001年04月27日 17:58Windows服务在Visual Studio 以前的版本中叫NT服务,在VS.net启用了新的名称。用Visual C# 创建Windows服务不是一件困难的事,本文就将指导你一步一步创建一个Windows服务并使用它。这个服务在启动和停止时,向一

  • c#编写部署windows服务

    什么是windows服务      Windows服务,微软的官方定义是这样的:Microsoft Windows 服务(即以前的 NT 服务)使您能够创建在它们自己的 Windows 会话中可长时间运行的可执行应用程序。这些服务可以在计算机启动时自动启动,可以暂停、禁用和重新启动而且不显示任何用户界面。 查找服务          Window开始-搜索栏输入“服务”-即可找到服务

  • coreseek-4.1-win64支持多拼音全文搜索索引

    全文搜索coreseek+sphinx支持拼音搜索,Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索...

  • Coreseek开源中文检索引擎 coreseek-4.1 win7安装教程

     coreseek-4.1-win32,下载后解压到相应目录,我这里安装的是在d:/web/coreseek下。所以下面很多涉及到安装的地方需要自己做相应修改!下载解压后,把D:webcoreseeketccsft_mysql.conf 这个文件复制一份到D:...

  • coreseek-4.1中文全文检索/搜索软件

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

  • Coreseek开源中文检索引擎-Sphinx中文版

    #RT实时索引配置,详情请查看:http://www.coreseek.cn/products-install/rt-indexes/ #RT实时索引定义 index rtindex { type = rt path = var/data/rtindex #请修改为实际使用的绝对路径,例如:/usr/l

  • coreseek4.1.zip

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

  • wordpress使用coreseek(sphinx)全文索引

    wordpress的默认搜索是采用mysql的like,但是当我们整个网站的数据非常大的时候...Coreseek开源中文检索引擎,可以说是Sphinx中文版,因为coreseek加入了中文分词库,大家可以到官网去查看具体介绍:http://www.corese

  • Coreseek中文检索引擎

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

  • Coreseek 全文搜索服务器2.5

    Coreseek 全文搜索服务器2.5 是在开源的全文搜索引擎Sphinx上修改增强而来的;并在GPL协议下重新发行。

  • Linux coreseek开源中文检索引擎-Sphinx中文版安装

    下载并解压coreseekcd /usr/local/srcwget http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gztar zxvf coreseek-4.1-beta.tar.gz安装词库yum -y installexpatexpat-develpython python-dev...

  • ubuntu-10.04的测试环境 安装测试 Coreseek开源中文检索引擎-Sphinx中文版

    主要参考文档:...coreseek安装需要预装的软件: apt-get install make gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexp...

  • CoreSeek(全文检索引擎 Sphinx 中文版)安装使用指南(CentOS6.5)

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

  • Coreseek开源中文检索引擎-Sphinx中文版 - 首页 - 论坛搜索、信息...

    Coreseek开源中文检索引擎-Sphinx中文版 - 首页 - 论坛搜索、信息... 转载于:https://blog.51cto.com/lzlhen1988/1342926

  • (Linux)sphinx检索Coreseek中文全文检索引擎安装和使用

    这几天学习coreseek中文全文检索引擎的理解,遇到了一些问题,也看了别人的文章以及手册,总结总结

  • linux搜索中文,Linux下sphinx检索Coreseek中文全文检索引擎安装和使用

    sphinx(开源全文检索引擎)Coreseek(开源的中文全文检索引擎)coreseek是一个针对于中文检索方案的一种全文检索技术,基于sphinx开发的。至于好处,简单说就是迅速和高效,尤其是在当今科技迅速发展的前提下,我们要在...

  • coreseek4.1 支持拼音索引 win32

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

  • Centos7下安装coreseek中文检索引擎

    一、介绍:Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、...

  • mysql全文检索性能

    Lucene可以对MYSQL进行全文检索吗 Lucene是可以的,它常见的用例就是在一个或者多个数据库表进行全文检索。虽然MySql有全文检索的功能,但是如果字段和数据量增加,MySql的性能会减低很快。 本回答由网友推荐 ...

Global site tag (gtag.js) - Google Analytics