`
syu
  • 浏览: 16740 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

coreseek检索时全角字符对全文检索质量的影响

阅读更多

近来试用一段时间后,发现一些全角字符,尤其是双引号,书名号对英文的影响有些严重.

比如搜索PHP时,出来的前几条中都没有PHP词样.经过一段时间观察,发现这些出现异常的内容里,都带有这些全角符号.

李沫南说其它应用网站未发现这个状态.但我这儿两台测试机都已发生此现象.

详细内容还得观察一段时间.目前只能暂时将全角符号在数据源上做转换.(亦可用pythone数据源在提供给sphinx时做转换).

如有相同故障的同学亦可暂时试用此法.

附,另有一法.可以设置stopwords,在停用词表中加入符号字符

另.coreseek的B2版,API中Setweidht有故障无法使用,需升级到B3或B4.

分享到:
评论

相关推荐

    基于Coreseek+Python的分布式全文检索方法.pdf

    综上所述,文档“基于Coreseek+Python的分布式全文检索方法.pdf”详细介绍了如何利用Coreseek全文检索引擎和Python数据源程序接口,构建一个分布式全文检索系统,以解决大数据环境下数据检索的性能和兼容性问题。...

    Coreseek 全文搜索服务器2.5

    **Coreseek 全文搜索服务器2.5**是一款基于开源全文搜索引擎Sphinx进行修改和增强的产品,它在原生Sphinx的基础上提供了更多的功能和优化,旨在为企业和开发者提供更高效、更灵活的全文检索解决方案。在GPL协议下,...

    Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册

    《Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册》详述了Coreseek全文检索服务器的核心功能、安装配置、索引建立、搜索机制以及API接口等内容,旨在帮助用户深入理解和高效使用该服务器。 1. **简介** - **...

    基于Coreseek+Python的分布式全文检索方法.zip

    **基于Coreseek+Python的分布式全文检索方法** 在信息技术领域,全文检索是一种高效的数据搜索技术,它允许用户通过输入关键词来查找文档中的相关信息。Coreseek和Python是实现这种功能的两个重要工具。Coreseek是...

    coreseek-4.1中文全文检索/搜索软件

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    coreseek4.1.zip

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    coreseek-3.2.14-win32

    总的来说,"coreseek-3.2.14-win32"为Windows用户提供了强大的中文全文检索解决方案,通过与Sphinx的结合,实现了对中文文本的高效处理和检索。对于需要在网站、应用或系统中实现中文搜索功能的开发者而言,这是一个...

    CoreseekDocker:Coreseek 中文全文检索服务的 Dockerfile

    Coreseek DockerfileCoreseek 是一款中文全文检索/搜索软件,以 GPLv2 许可协议开源发布,基于 Sphinx 研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献...

    Coreseek Fulltext Server (源码)

    Coreseek Fulltext Server 是一款开源的全文搜索引擎,专为中文环境设计,提供了强大的全文检索功能。这款服务器软件的源代码开放,允许开发者深入研究其内部机制,为自己的项目进行定制或优化。在搜索引擎领域,...

    coreseek安装

    Coreseek 是一个专为中国市场设计的全文检索和搜索软件,它基于Sphinx技术,但能够独立运行。作为一个开源项目,它遵循GPLv2许可证,广泛应用于各种场景,如行业垂直搜索、论坛内部搜索、数据库搜索、文档检索、信息...

    coreseek-3.2.14稳定版,,站内中文检索

    sphinx coreseek-3.2.14.tar.gz稳定版,中文检索利器。

    coreseek-4.1.zip windows版

    Coreseek的核心是基于Sphinx搜索引擎,Sphinx是一款高性能、可配置的全文检索引擎,尤其在处理大量数据时表现突出。它支持多种数据库,如MySQL、PostgreSQL等,可以与这些数据库进行实时索引,实现快速查询。Sphinx...

    coreseek的demo 20141224修改

    CoreSeek是一款基于Sphinx搜索引擎的开源全文检索解决方案,它在中国的开源社区中有着广泛的应用。本教程将深入探讨2014年12月24日版本的CoreSeek demo,以及与其密切相关的Sphinx搜索引擎的核心概念和技术。 一、...

    coreseek搜索服务1

    CoreSeek是一款开源的全文搜索引擎,它集成了Sphinx搜索服务器和中文分词器,为用户提供高效、精准的全文检索功能。在IT领域,全文搜索引擎对于处理大量数据的快速检索至关重要,尤其在电商、资讯网站等对搜索性能有...

    coreseek(sphinx + 中文分词)

    Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...

    sphinx mmseg coreseek 搜狗 词库

    Sphinx支持实时索引,可以处理大量数据,且提供了丰富的API供开发者调用,实现快速、精准的全文检索。它具有低延迟、高精度的特性,使得它在各种项目中受到青睐。 接着是MMSEG(Maximum Matching Segmentation),...

    coreseek中文全文索引解决方案

    在MySQL的基础上,CoreSeek融入了Sphinx全文索引引擎,使得对中文文本的检索性能得到了显著提升,尤其适合处理大量中文数据的搜索需求。 **1. CoreSeek的核心特性** CoreSeek的核心在于其内置的Sphinx全文索引引擎...

    coreseek4.1 for window

    CoreSeek4.1是专为Windows平台设计的一款高效、强大的全文检索搜索引擎,它基于开源项目Sphinx,并且针对中文环境进行了优化。Sphinx是一款广泛应用于网站、数据库等场景的实时搜索解决方案,以其高速、准确和易用性...

    coreseek3.1.14

    CoreSeek是一款开源的全文搜索引擎服务器,它提供了强大的信息检索功能,并且可以方便地与各种数据库、应用程序集成。在CoreSeek3.1.14版本中,我们主要关注以下几个关键知识点: 1. **核心组件**:CoreSeek的核心...

Global site tag (gtag.js) - Google Analytics