`
helloyesyes
  • 浏览: 1311062 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

Sphinx高亮故障的解决

 
阅读更多

最近组里同事开发项目时遇到一个Sphinx的问题,表面上看起来没有问题的代码,实际运行时却总是无法的到正常的结果。

我看了一下,主要的代码片段如下:

遇到的情况却是标题里的高亮显示没有问题,但是介绍里的高亮却总是没有办法出来。

经过反复调试,发现和参数传递,过程处理,字符编码都没有关系,得到的结果在第二句search_highlight处理时总是固执的没有任何变化。

后来又把问题放在了参数设置上,将single_passage、exact_phrase两个参数去掉,替换before_match、after_match,都没有得到任何的成效。

一筹莫展时,突然看到了around这个参数,一般我们都设置为3,而这里设置为30,把这个参数改一改试试,发现It works!

经过调试,发现around值为25的时候能满足功能和产品的需求。

这个问题可能是Sphinx的一个bug,在某些特定条件下高亮的截取会失败,在有时间的时候我会阅读源码来调查这个问题的产生根源。

分享到:
评论

相关推荐

    中文搜索解决方案之sphinx

    标题中的“中文搜索解决方案之sphinx”表明我们将讨论如何使用Sphinx搜索引擎来处理中文文本的检索问题。Sphinx是一款开源的、高性能的全文搜索引擎库,它最初是为了解决数据库的全文检索问题而设计的,尤其在处理...

    语音识别 sphinx4 JAVA 教程

    【语音识别技术与Sphinx-4简介】 ...总之,Sphinx-4为Java开发者提供了一种强大的语音识别解决方案,虽然中文模型的建立相对复杂,但通过不断学习和实践,开发者可以克服这一挑战,实现高效、准确的语音识别功能。

    php7的sphinx扩展,适用linux,mac

    本文将深入探讨PHP7中的Sphinx扩展,包括其在Linux和Mac操作系统上的安装与配置,以及如何解决libsphinxclient相关的错误。 首先,Sphinx扩展为PHP7提供了原生支持,允许开发者利用Sphinx的特性进行快速、精准的...

    java 整合 sphinx

    Sphinx设计的目标是提供一个快速、可扩展的搜索解决方案,它支持实时索引,可以处理大量数据,并且具有高效的数据存储和检索能力。Sphinx的核心特性包括:全文索引、布尔操作符、短语匹配、近似搜索、同义词处理、...

    sphinx+mysql 安装手册

    结合MySQL数据库,可以构建出强大的、适用于千万级数据的全文检索解决方案。本手册将详细讲解如何在生产环境中安装和配置Sphinx以及与MySQL的集成。 ### 一、Sphinx简介 Sphinx提供实时索引、低延迟查询、布尔运算...

    pocketsphinx语音库

    **Pocketsphinx语音库详解** ...6. **问题排查**:列出常见的错误和解决办法,帮助读者解决问题。 通过以上内容,读者不仅可以了解Pocketsphinx的基本原理,还能掌握如何在实践中运用这个强大的语音识别工具。

    sphinx3-0.4.1.rar_Sphinx3_c 语音识别

    sphinx系统是一个拥有悠久历史的语音识别系统,李开复自称第一个sphinx是他写的。 传说 中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和 sphinx2请大家...

    sphinx算法分析

    **Sphinx算法分析** Sphinx是一款高性能、全功能的搜索引擎库,被广泛应用于网页搜索、数据库全文检索等场景。它以其高效、可扩展性以及高度定制化的特点深受开发者喜爱。在深入研究Sphinx源码的过程中,理解其核心...

    sphinx支持discuz包

    **Sphinx 概述** Sphinx 是一个高性能、全文搜索引擎库,主要被设计用于Web应用,提供快速且精准的搜索功能。它是一个开源项目,由俄罗斯的 Andrew Aksyonov 创建,起初是为了解决其在线教育平台的搜索需求。Sphinx...

    Sphinx-JAVA接口

    6. **高亮显示**: JAVAAPI提供了文本高亮功能,可以在搜索结果中突出显示匹配的关键词。 7. **分页和限制**: 可以设置查询的偏移量和最大返回记录数,实现搜索结果的分页。 8. **分布式搜索**: 如果Sphinx部署在多...

    sphinx中文语音训练手册

    可能会因为bergtrain.dic中不存在“计算机高手”而报错,解决的办法如下: 1、复杂型:使用分词将“计算机高手”划分到bergtrain.dic所包含的 “计算机 高手”。 2、简单型:直接添加空格,划分为“计 算 机 高 手”...

    sphinx扩展,适用linux

    Sphinx 是一个强大的全文搜索引擎,尤其适用于实时...Sphinx 提供了丰富的 API 和配置选项,可以帮助你构建出满足业务需求的定制化搜索解决方案。同时,coreseek 对中文的支持,使得在中文环境下使用 Sphinx 成为可能。

    sphinx无法启动的解决.docx

    Sphinx无法启动的解决方案 一、配置文件编码格式错误 sphinx 无法启动的解决方案中,遇到 ERROR: invalid token in 配置文件 line 1 col 1Error,表示当前的配置文件的编码不是 UTF-8(无BOM头)格式,无法正确解析...

    sphinx中文包zh-CN.zip

    - Sphinx有一个活跃的开源社区,提供了丰富的文档、教程和示例代码,方便开发者学习和解决问题。 总之,"sphinx中文包zh-CN.zip" 是一个专为处理中文语音识别而设计的工具包,包含了必要的模型和数据,可广泛应用...

    数据库 搜索引擎 sphinx

    数据库搜索引擎Sphinx是一款高效、可定制且功能丰富的全文搜索引擎,主要设计用于Web应用,以便快速地从大量数据中检索相关信息。Sphinx的核心特性包括实时索引、近实时搜索以及高度可扩展性,使得它在处理大数据量...

    Sphinx-完整中文手册

    总结来说,Sphinx和Coreseek提供了全面的全文检索解决方案,涵盖了从建立索引到执行搜索查询的各个方面。它们的高效性、灵活性以及丰富的功能使得它们成为企业和开发者在进行文本信息检索时的理想选择。而提供的中文...

    CMU Sphinx的语音模型

    CMU Sphinx是一款开源的语音识别引擎,主要用于将连续的语音信号转换为文本。这款工具广泛应用于各种领域,如智能家居、语音助手、电话自动服务系统等。CMU Sphinx由卡内基梅隆大学(Carnegie Mellon University)...

    ha_sphinx for mysql5.5.29

    6. **监控与维护**:定期检查Sphinx和MySQL的日志,监控系统的资源使用情况,及时发现并解决可能的问题。 ha_sphinx与MySQL 5.5.29的结合,使得开发者和DBA能够充分利用Sphinx的强大搜索能力,同时保持对MySQL...

    pocketsphinx-android-demo资源包

    《探索pocketsphinx-android-demo:语音识别在Android平台的应用》 在移动设备上,语音识别技术已经成为人机交互的重要组成部分,极大地提升了用户体验。本资源包——"pocketsphinx-android-demo",是专为Android...

    CoreSeek/Sphinx中文手册

    在实际部署Sphinx时,开发者可能会遇到各种实际问题,Sphinx的文档提供了相关工具的参考指南以及常见问题的解决方法,帮助用户在出现问题时能够快速定位并解决。 综上所述,CoreSeek/Sphinx作为一个功能丰富、性能...

Global site tag (gtag.js) - Google Analytics