`
lzj0470
  • 浏览: 1273642 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

sphinx 有些中文搜索不到

阅读更多
昨天,搞了一天,在win2003下,搜索中文有些可以搜索的出来,有些搜索不出来,已经确定mysql 编码为utf8,代码编码也是utf8,配置文件也设置了utf-8,但是就是搜索不出来,郁闷了,why? 没办法,搞不定,重新照抄别人的例子,咦~~,搜索中文没问题,为什么在我这里就不行呢?接着,拿它的配置文件跟我的对照一般,发现它的配置文件里面存在min_infix_len = 1,而我的到charset_table就结束啦。我测试了一下,有结果了。可以搜索中文。呵呵。 我的配置文件为: source newgn { type = mysql sql_host = localhost sql_user = root sql_pass = 123 sql_db = search sql_port = 3306 sql_query_pre = SET NAMES utf8 sql_query = SELECT id, UNIX_TIMESTAMP(date_added) AS date_added, title, content,hits FROM newgn sql_attr_uint = hits sql_attr_uint = date_added } index newgn { source = newgn path = E:/sphinx/data/newgn docinfo = extern mlock = 0 morphology = none min_word_len = 1 charset_type = utf-8 charset_table = U+FF10..U+FF19->0..9, 0..9, U+FF41..U+FF5A->a..z, U+FF21..U+FF3A->a..z,\ A..Z->a..z, a..z, U+0149, U+017F, U+0138, U+00DF, U+00FF, U+00C0..U+00D6->U+00E0..U+00F6,\ U+00E0..U+00F6, U+00D8..U+00DE->U+00F8..U+00FE, U+00F8..U+00FE, U+0100->U+0101, U+0101,\ U+0102->U+0103, U+0103, U+0104->U+0105, U+0105, U+0106->U+0107, U+0107, U+0108->U+0109,\ U+0109, U+010A->U+010B, U+010B, U+010C->U+010D, U+010D, U+010E->U+010F, U+010F,\ U+0110->U+0111, U+0111, U+0112->U+0113, U+0113, U+0114->U+0115, U+0115, \ U+0116->U+0117,U+0117, U+0118->U+0119, U+0119, U+011A->U+011B, U+011B, U+011C->U+011D,\ U+011D,U+011E->U+011F, U+011F, U+0130->U+0131, U+0131, U+0132->U+0133, U+0133, \ U+0134->U+0135,U+0135, U+0136->U+0137, U+0137, U+0139->U+013A, U+013A, U+013B->U+013C, \ U+013C,U+013D->U+013E, U+013E, U+013F->U+0140, U+0140, U+0141->U+0142, U+0142, \ U+0143->U+0144,U+0144, U+0145->U+0146, U+0146, U+0147->U+0148, U+0148, U+014A->U+014B, \ U+014B,U+014C->U+014D, U+014D, U+014E->U+014F, U+014F, U+0150->U+0151, U+0151, \ U+0152->U+0153,U+0153, U+0154->U+0155, U+0155, U+0156->U+0157, U+0157, U+0158->U+0159,\ U+0159,U+015A->U+015B, U+015B, U+015C->U+015D, U+015D, U+015E->U+015F, U+015F, \ U+0160->U+0161,U+0161, U+0162->U+0163, U+0163, U+0164->U+0165, U+0165, U+0166->U+0167, \ U+0167,U+0168->U+0169, U+0169, U+016A->U+016B, U+016B, U+016C->U+016D, U+016D, \ U+016E->U+016F,U+016F, U+0170->U+0171, U+0171, U+0172->U+0173, U+0173, U+0174->U+0175,\ U+0175,U+0176->U+0177, U+0177, U+0178->U+00FF, U+00FF, U+0179->U+017A, U+017A, \ U+017B->U+017C,U+017C, U+017D->U+017E, U+017E, U+0410..U+042F->U+0430..U+044F, \ U+0430..U+044F,U+05D0..U+05EA, U+0531..U+0556->U+0561..U+0586, U+0561..U+0587, \ U+0621..U+063A, U+01B9,U+01BF, U+0640..U+064A, U+0660..U+0669, U+066E, U+066F, \ U+0671..U+06D3, U+06F0..U+06FF,U+0904..U+0939, U+0958..U+095F, U+0960..U+0963, \ U+0966..U+096F, U+097B..U+097F,U+0985..U+09B9, U+09CE, U+09DC..U+09E3, U+09E6..U+09EF, \ U+0A05..U+0A39, U+0A59..U+0A5E,U+0A66..U+0A6F, U+0A85..U+0AB9, U+0AE0..U+0AE3, \ U+0AE6..U+0AEF, U+0B05..U+0B39,U+0B5C..U+0B61, U+0B66..U+0B6F, U+0B71, U+0B85..U+0BB9, \ U+0BE6..U+0BF2, U+0C05..U+0C39,U+0C66..U+0C6F, U+0C85..U+0CB9, U+0CDE..U+0CE3, \ U+0CE6..U+0CEF, U+0D05..U+0D39, U+0D60,U+0D61, U+0D66..U+0D6F, U+0D85..U+0DC6, \ U+1900..U+1938, U+1946..U+194F, U+A800..U+A805,U+A807..U+A822, U+0386->U+03B1, \ U+03AC->U+03B1, U+0388->U+03B5, U+03AD->U+03B5,U+0389->U+03B7, U+03AE->U+03B7, \ U+038A->U+03B9, U+0390->U+03B9, U+03AA->U+03B9,U+03AF->U+03B9, U+03CA->U+03B9, \ U+038C->U+03BF, U+03CC->U+03BF, U+038E->U+03C5,U+03AB->U+03C5, U+03B0->U+03C5, \ U+03CB->U+03C5, U+03CD->U+03C5, U+038F->U+03C9,U+03CE->U+03C9, U+03C2->U+03C3, \ U+0391..U+03A1->U+03B1..U+03C1,U+03A3..U+03A9->U+03C3..U+03C9, U+03B1..U+03C1, \ U+03C3..U+03C9, U+0E01..U+0E2E,U+0E30..U+0E3A, U+0E40..U+0E45, U+0E47, U+0E50..U+0E59, \ U+A000..U+A48F, U+4E00..U+9FBF,U+3400..U+4DBF, U+20000..U+2A6DF, U+F900..U+FAFF, \ U+2F800..U+2FA1F, U+2E80..U+2EFF,U+2F00..U+2FDF, U+3100..U+312F, U+31A0..U+31BF, \ U+3040..U+309F, U+30A0..U+30FF,U+31F0..U+31FF, U+AC00..U+D7AF, U+1100..U+11FF, \ U+3130..U+318F, U+A000..U+A48F,U+A490..U+A4CF min_infix_len = 1 } indexer { mem_limit = 32M } searchd { port = 3312 log = E:/sphinx/log/searchd.log query_log = E:/sphinx/log/query.log read_timeout = 5 max_children = 30 pid_file = E:/sphinx/log/searchd.pid max_matches = 1000 preopen_indexes = 0 unlink_old = 1 }
0
0
分享到:
评论

相关推荐

    用Sphinx搭建MySQL中文全文搜索

    在构建大型数据应用时,全文搜索引擎常常是必不可少的工具,特别是在处理中文文本时。MySQL作为广泛应用的关系型数据库,虽然内置的全文搜索功能在英文环境下表现出色,但在处理中文时则显得力不从心。这时,我们...

    CoreSeek/Sphinx中文手册

    建立索引是Sphinx搜索服务的核心部分,涉及到定义数据源、属性、多值属性(MVA)、索引设置、数据源限制和字符集处理。Sphinx支持多种数据源,如SQL、xmlpipe、Python等,每种数据源都有其特定的索引方式和配置选项...

    Sphinx-完整中文手册

    在搜索方面,Sphinx提供了多种匹配模式,包括但不限于布尔查询语法和扩展查询语法。用户可以根据实际需要设置查询的权值计算,以实现更准确的搜索结果。排序模式可以按照用户的特定需求对搜索结果进行排序。结果分组...

    sql全文索引 sphinx

    SQL全文索引是一种在数据库中实现全文搜索的技术,它允许用户使用自然语言查询数据库,而不仅仅是精确匹配。Sphinx是一个高性能、开源的全文搜索引擎,它为SQL数据库提供了强大的全文索引功能。Sphinx与SQL结合使用...

    php7的sphinx扩展,适用linux,mac

    总结,PHP7的Sphinx扩展是实现高效全文搜索的关键组件,尤其在处理大量数据和中文文本时。正确安装和配置Sphinx、CoreSeek以及相应的客户端库,能为开发者带来便捷的搜索体验。在Linux和Mac环境下,需注意系统依赖和...

    sphinx社区全文搜索平台配置手册.docx

    **Sphinx 社区全文搜索平台配置手册** Sphinx 是一款源自俄罗斯的开源全文搜索引擎,以其高效的性能和灵活的配置闻名。在面对如 Discuz! 这样的大型论坛系统时,传统的 MySQL 数据库的全文搜索功能往往力不从心,而...

    sphinx社区全文搜索平台配置手册.pdf

    5. 编译Sphinx过程中可能会遇到的问题,如找不到mysql路径或libiconv库,需要相应地配置环境变量或安装缺失的库。 Sphinx的全文检索方案构架图通常包括数据源(如Discuz!的MySQL数据库)、Sphinx的数据采集(如通过...

    基于Sphinx+MySql+Python的站内搜索引擎的设计与实现.pdf

    这种方法不改变现有网站架构,可以直接应用到现有的网站中,构建出性能优越的站内搜索引擎。 6. 关键技术应用与优化: 为了提升搜索引擎的性能和用户体验,关键在于索引构建的优化、搜索算法的选取和结果排序的合理...

    sphinx 中英文分词检索介绍

    4. **优秀的中文分词能力**:Sphinx内置了MMSEG中文分词器,能够有效地对中文文本进行分词处理,从而提升中文搜索的准确性和效率。此外,还有专门为中文优化的版本——Coreseek。 #### 三、Sphinx的优势与局限性 **...

    Windows下安装使用Sphinx

    2. **高速搜索**:在 2-4GB 的文本量中,平均查询速度不到 0.1 秒。 3. **高可用性**:单 CPU 可支持高达 100GB 的文本和 100M 文档。 4. **良好的相关性排名**:支持复杂的排名算法,确保搜索结果的相关性。 5. **...

    公司sphinx搜索学习ppt

    - **Coreseek** 是一个基于Sphinx开发的中文全文检索/搜索软件,以GPLv2许可协议开源发布。它专为中文搜索和信息处理领域设计,广泛应用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据...

    sphinx中文广播模型

    Sphinx中文广播模型的应用场景广泛,包括但不限于新闻转录服务、语音助手、智能音箱和车载导航系统等。通过持续的优化和更新,Sphinx可以更好地服务于中文语音识别的需求,促进人机交互的智能化。

    Sphinx搜索引擎架构与使用文档(和MySQL结合)V1.1_张宴

    Sphinx 支持多种数据源,如 MySQL,允许开发者将搜索功能无缝集成到现有的数据库系统中。 ### 一、XX网搜索引擎架构设计 1. **搜索引擎架构图**:基于 PHP+MySQL+Sphinx 的架构,主要由三部分组成:前端用户界面...

    Sphinx 使用经验分享

    它的核心优势在于其高速的索引构建能力(可达10MB/s)和高效的搜索性能(在2-4GB的文本量中平均查询速度不到0.1秒)。Sphinx支持分布式搜索,能处理大量数据(单CPU支持最大100GB文本和100万条记录),并且提供优秀...

    sphinx/coreseek权威手册中文版

    总的来说,Sphinx/Coreseek权威手册中文版是一本详尽的指南,涵盖了从安装、配置到开发和优化的全过程,是理解和使用Sphinx/Coreseek进行全文检索的宝贵资源。无论你是初学者还是经验丰富的开发者,都能从中受益匪浅...

    使用Sphinx对索引进行搜索

    Sphinx 是一个高性能的全文搜索引擎库,常用于构建复杂、高效的全文检索系统。它支持实时索引、布尔运算符、短语搜索、拼写检查、近似搜索等多种功能,广泛应用于网站、数据库和各种信息系统的搜索功能。在使用 ...

    sphinx-for-chinese + windows配置流程

    它支持多种语言,包括但不限于英语、俄语、中文等。Sphinx的核心优势在于其高效的搜索速度和灵活的搜索功能。 #### 三、下载与安装 1. **下载Sphinx for Chinese** - 版本:sphinx-for-chinese-2.2.1-dev-r4311-...

Global site tag (gtag.js) - Google Analytics