`
isiqi
  • 浏览: 16551433 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

改变了一下 sphinx 搜索的架构

阅读更多

以前直接使用 mmseg 的字典和使用 csft 的全文搜索

基本需求是能达到。不过词性分析方面不是很好。 换另外一种架构就是。 scws + sphinx

scws 有词性分析和准确的分词。

sphinx 就只管全文搜索就好。。这样不是更好。。然后我做了小部分的测试

先是

scws :

安装 scws 和 安装了php扩展。然后上菜:

按照官方的例子:

值得注意的是。 add_dict 添加自定义字典。 那个字典不能放到 和scws 默然的字典那个地方。否则。。不正常。

然后装了原生的 sphinx

帖配置文件吧:

需要注意的问题是: 代码文件必须是utf8 编码。否则中文无法搜索命中。

分享到:
评论

相关推荐

    基于Sphinx+MySql+Python的站内搜索引擎的设计与实现.pdf

    1. Sphinx搜索引擎介绍: Sphinx是一个开源的全文搜索引擎,采用GPLv2许可证发布,专门为数据库全文检索提供解决方案。它具有快速建立索引、高性能搜索和处理海量数据的能力。Sphinx支持多种检索模式,比如布尔检索...

    sphinx 中英文分词检索介绍

    通过与MySQL集成,Sphinx能够在不改变原有应用架构的情况下大幅提升搜索性能。 #### 二、为什么选择Sphinx? 1. **高速索引能力**:Sphinx能够以极快的速度构建索引。在现代处理器上,每秒可以处理近10MB的数据,这...

    sphinx4-1.0beta6-src

    1. **模块化设计**:Sphinx4采用了模块化的架构,主要包括前端处理、声学模型、语言模型和解码器等组件,使得开发者可以根据需要选择和替换不同的模块。 2. **实时处理**:Sphinx4支持实时语音识别,能够处理连续的...

    Atom-language-sphinx,Atom的Sphinx语法包。贡献Siko1056/语言.zip

    为了安装和使用这个插件,你需要先确保已经安装了Atom文本编辑器,然后可以通过Atom的包管理器搜索“language-sphinx”进行安装。安装完成后,在编辑Sphinx reST文件时,Atom将自动应用这些增强功能。 总的来说,...

    PyPI 官网下载 | Sphinx-1.0.6-py2.4.egg

    3. **主题和模板**:Sphinx提供了多种预定义的主题,可以轻松改变文档的外观。同时,用户也可以自定义模板,以满足特定的样式需求。 4. **多格式输出**:生成的文档可以导出为多种格式,包括HTML、PDF、EPUB、Man ...

    PocketSphinxAndroidDemo.rar

    5. **优化性能**:为了提高识别准确性和减少资源消耗,可能需要调整Sphinx的参数,如增加词汇限制、改变搜索策略等。 **应用场景** 1. **移动应用**:在Android应用中,如智能助手、游戏或教育应用,用户可以通过...

    sphinx

    Sphinx 提供了简洁的文本语法,可以轻松创建结构化的、专业质量的文档,同时支持自动生成API参考、索引、图示和其他复杂的技术文档元素。 在HTML方面,Sphinx 尤其出色,因为它能够生成高质量的HTML格式文档。HTML...

    精品资料(2021-2022收藏)Lucene:基于Java的全文检索引擎简介.docx

    例如,可以编写自定义的`Filter`或`Sort`类以改变默认的搜索行为。 6. **Lucene与其他全文引擎的比较** 虽然Lucene非常强大且灵活,但在某些场景下,其他全文引擎如Sphinx可能更具优势。Sphinx以其更快的速度、...

    新零售综合解决方案 (2).pptx

    稳定卓越的技术架构包括分布式数据存储、三级缓存、Sphinx搜索引擎,确保网站速度和安全性。HTTP SSL认证、访问权限控制、SSO单点登录、API签名授权以及用户数据加密等措施进一步保障系统安全。 此外,ONex在线零售...

    如何制作HTML帮助文档

    首先,你需要确定帮助文档的内容结构,这通常包括首页、目录、索引、主题页和搜索功能。制定一个清晰的层级结构,确保用户可以快速找到所需信息。例如,可以创建一个主菜单,下设各个功能或问题类别,每个类别下再...

    php 文件管理系统代码php 文件管理系统代码

    这可能涉及到对文件名、内容甚至元数据的全文搜索,可以利用PHP的正则表达式或第三方全文搜索引擎如Sphinx。 8. **模板引擎**:为了实现用户友好的界面,开发者通常会使用模板引擎(如Smarty或Twig)将后端逻辑与...

    整理mysql数据库的28个知识点.docx

    - MyISAM支持全文索引,InnoDB不直接支持(需要借助全文搜索引擎如Sphinx或Lucene)。 3. **VARCHAR与CHAR的区别**: - VARCHAR是可变长度的字符串类型,CHAR是固定长度的。 - VARCHAR(50)中的50表示最多存储50...

    基于PHP的多彩贴吧(phpcolor)v4.0Beta源码.zip

    为了方便用户查找相关信息,phpcolor可能集成了全文搜索功能,这可能涉及到了SQL的LIKE操作或者更复杂的全文索引技术如Sphinx或Elasticsearch。 7. 插件与主题系统: 为增强用户体验和个性化,phpcolor可能会有...

    machine learning中文

    - **语音识别**:所有最先进的语音识别系统均采用了机器学习技术,如Sphinx系统能识别特定说话人的语音特征,而神经网络和隐马尔可夫模型则帮助系统自动适应不同说话人、词汇和环境条件。 - **驾驶车辆**:ALVINN...

    mysql面试题汇总文档

    - **全文索引**:MyISAM支持全文索引,InnoDB不直接支持,但可以通过全文搜索引擎如Sphinx进行扩展。 3. **InnoDB的四大特性**: - **插入缓冲(Insert Buffer)**:用于合并对非聚簇索引页的插入操作,减少I/O。...

    MySQL延迟关联性能优化方法

    优化此类查询有多种方法,例如前端缓存、优化SQL、使用书签法或引入全文搜索引擎如Sphinx。这里我们关注“延迟关联”这一优化策略。延迟关联的核心思想是:先通过覆盖索引获取需要的主键,然后用这些主键去原表中...

Global site tag (gtag.js) - Google Analytics