昨天,搞了一天,在win2003下,搜索中文有些可以搜索的出来,有些搜索不出来,已经确定mysql 编码为utf8,代码编码也是utf8,配置文件也设置了utf-8,但是就是搜索不出来,郁闷了,why?
没办法,搞不定,重新照抄别人的例子,咦~~,搜索中文没问题,为什么在我这里就不行呢?接着,拿它的配置文件跟我的对照一般,发现它的配置文件里面存在min_infix_len = 1,而我的到charset_table就结束啦。我测试了一下,有结果了。可以搜索中文。呵呵。
我的配置文件为:
source newgn
{
type = mysql
sql_host = localhost
sql_user = root
sql_pass = 123
sql_db = search
sql_port = 3306
sql_query_pre = SET NAMES utf8
sql_query = SELECT id, UNIX_TIMESTAMP(date_added) AS date_added, title, content,hits FROM newgn
sql_attr_uint = hits
sql_attr_uint = date_added
}
index newgn
{
source = newgn
path = E:/sphinx/data/newgn
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
charset_type = utf-8
charset_table = U+FF10..U+FF19->0..9, 0..9, U+FF41..U+FF5A->a..z, U+FF21..U+FF3A->a..z,\
A..Z->a..z, a..z, U+0149, U+017F, U+0138, U+00DF, U+00FF, U+00C0..U+00D6->U+00E0..U+00F6,\
U+00E0..U+00F6, U+00D8..U+00DE->U+00F8..U+00FE, U+00F8..U+00FE, U+0100->U+0101, U+0101,\
U+0102->U+0103, U+0103, U+0104->U+0105, U+0105, U+0106->U+0107, U+0107, U+0108->U+0109,\
U+0109, U+010A->U+010B, U+010B, U+010C->U+010D, U+010D, U+010E->U+010F, U+010F,\
U+0110->U+0111, U+0111, U+0112->U+0113, U+0113, U+0114->U+0115, U+0115, \
U+0116->U+0117,U+0117, U+0118->U+0119, U+0119, U+011A->U+011B, U+011B, U+011C->U+011D,\
U+011D,U+011E->U+011F, U+011F, U+0130->U+0131, U+0131, U+0132->U+0133, U+0133, \
U+0134->U+0135,U+0135, U+0136->U+0137, U+0137, U+0139->U+013A, U+013A, U+013B->U+013C, \
U+013C,U+013D->U+013E, U+013E, U+013F->U+0140, U+0140, U+0141->U+0142, U+0142, \
U+0143->U+0144,U+0144, U+0145->U+0146, U+0146, U+0147->U+0148, U+0148, U+014A->U+014B, \
U+014B,U+014C->U+014D, U+014D, U+014E->U+014F, U+014F, U+0150->U+0151, U+0151, \
U+0152->U+0153,U+0153, U+0154->U+0155, U+0155, U+0156->U+0157, U+0157, U+0158->U+0159,\
U+0159,U+015A->U+015B, U+015B, U+015C->U+015D, U+015D, U+015E->U+015F, U+015F, \
U+0160->U+0161,U+0161, U+0162->U+0163, U+0163, U+0164->U+0165, U+0165, U+0166->U+0167, \
U+0167,U+0168->U+0169, U+0169, U+016A->U+016B, U+016B, U+016C->U+016D, U+016D, \
U+016E->U+016F,U+016F, U+0170->U+0171, U+0171, U+0172->U+0173, U+0173, U+0174->U+0175,\
U+0175,U+0176->U+0177, U+0177, U+0178->U+00FF, U+00FF, U+0179->U+017A, U+017A, \
U+017B->U+017C,U+017C, U+017D->U+017E, U+017E, U+0410..U+042F->U+0430..U+044F, \
U+0430..U+044F,U+05D0..U+05EA, U+0531..U+0556->U+0561..U+0586, U+0561..U+0587, \
U+0621..U+063A, U+01B9,U+01BF, U+0640..U+064A, U+0660..U+0669, U+066E, U+066F, \
U+0671..U+06D3, U+06F0..U+06FF,U+0904..U+0939, U+0958..U+095F, U+0960..U+0963, \
U+0966..U+096F, U+097B..U+097F,U+0985..U+09B9, U+09CE, U+09DC..U+09E3, U+09E6..U+09EF, \
U+0A05..U+0A39, U+0A59..U+0A5E,U+0A66..U+0A6F, U+0A85..U+0AB9, U+0AE0..U+0AE3, \
U+0AE6..U+0AEF, U+0B05..U+0B39,U+0B5C..U+0B61, U+0B66..U+0B6F, U+0B71, U+0B85..U+0BB9, \
U+0BE6..U+0BF2, U+0C05..U+0C39,U+0C66..U+0C6F, U+0C85..U+0CB9, U+0CDE..U+0CE3, \
U+0CE6..U+0CEF, U+0D05..U+0D39, U+0D60,U+0D61, U+0D66..U+0D6F, U+0D85..U+0DC6, \
U+1900..U+1938, U+1946..U+194F, U+A800..U+A805,U+A807..U+A822, U+0386->U+03B1, \
U+03AC->U+03B1, U+0388->U+03B5, U+03AD->U+03B5,U+0389->U+03B7, U+03AE->U+03B7, \
U+038A->U+03B9, U+0390->U+03B9, U+03AA->U+03B9,U+03AF->U+03B9, U+03CA->U+03B9, \
U+038C->U+03BF, U+03CC->U+03BF, U+038E->U+03C5,U+03AB->U+03C5, U+03B0->U+03C5, \
U+03CB->U+03C5, U+03CD->U+03C5, U+038F->U+03C9,U+03CE->U+03C9, U+03C2->U+03C3, \
U+0391..U+03A1->U+03B1..U+03C1,U+03A3..U+03A9->U+03C3..U+03C9, U+03B1..U+03C1, \
U+03C3..U+03C9, U+0E01..U+0E2E,U+0E30..U+0E3A, U+0E40..U+0E45, U+0E47, U+0E50..U+0E59, \
U+A000..U+A48F, U+4E00..U+9FBF,U+3400..U+4DBF, U+20000..U+2A6DF, U+F900..U+FAFF, \
U+2F800..U+2FA1F, U+2E80..U+2EFF,U+2F00..U+2FDF, U+3100..U+312F, U+31A0..U+31BF, \
U+3040..U+309F, U+30A0..U+30FF,U+31F0..U+31FF, U+AC00..U+D7AF, U+1100..U+11FF, \
U+3130..U+318F, U+A000..U+A48F,U+A490..U+A4CF
min_infix_len = 1
}
indexer
{
mem_limit = 32M
}
searchd
{
port = 3312
log = E:/sphinx/log/searchd.log
query_log = E:/sphinx/log/query.log
read_timeout = 5
max_children = 30
pid_file = E:/sphinx/log/searchd.pid
max_matches = 1000
preopen_indexes = 0
unlink_old = 1
}
分享到:
相关推荐
在构建大型数据应用时,全文搜索引擎常常是必不可少的工具,特别是在处理中文文本时。MySQL作为广泛应用的关系型数据库,虽然内置的全文搜索功能在英文环境下表现出色,但在处理中文时则显得力不从心。这时,我们...
建立索引是Sphinx搜索服务的核心部分,涉及到定义数据源、属性、多值属性(MVA)、索引设置、数据源限制和字符集处理。Sphinx支持多种数据源,如SQL、xmlpipe、Python等,每种数据源都有其特定的索引方式和配置选项...
在搜索方面,Sphinx提供了多种匹配模式,包括但不限于布尔查询语法和扩展查询语法。用户可以根据实际需要设置查询的权值计算,以实现更准确的搜索结果。排序模式可以按照用户的特定需求对搜索结果进行排序。结果分组...
### Sphinx中文手册知识点详解 #### 一、简介 **1.1 什么是Sphinx** Sphinx是一款高性能且功能丰富的全文搜索引擎。它专为快速、准确地处理海量文本数据的搜索需求而设计。Sphinx适用于多种应用场景,如网站、...
SQL全文索引是一种在数据库中实现全文搜索的技术,它允许用户使用自然语言查询数据库,而不仅仅是精确匹配。Sphinx是一个高性能、开源的全文搜索引擎,它为SQL数据库提供了强大的全文索引功能。Sphinx与SQL结合使用...
总结,PHP7的Sphinx扩展是实现高效全文搜索的关键组件,尤其在处理大量数据和中文文本时。正确安装和配置Sphinx、CoreSeek以及相应的客户端库,能为开发者带来便捷的搜索体验。在Linux和Mac环境下,需注意系统依赖和...
**Sphinx 社区全文搜索平台配置手册** Sphinx 是一款源自俄罗斯的开源全文搜索引擎,以其高效的性能和灵活的配置闻名。在面对如 Discuz! 这样的大型论坛系统时,传统的 MySQL 数据库的全文搜索功能往往力不从心,而...
5. 编译Sphinx过程中可能会遇到的问题,如找不到mysql路径或libiconv库,需要相应地配置环境变量或安装缺失的库。 Sphinx的全文检索方案构架图通常包括数据源(如Discuz!的MySQL数据库)、Sphinx的数据采集(如通过...
这种方法不改变现有网站架构,可以直接应用到现有的网站中,构建出性能优越的站内搜索引擎。 6. 关键技术应用与优化: 为了提升搜索引擎的性能和用户体验,关键在于索引构建的优化、搜索算法的选取和结果排序的合理...
4. **优秀的中文分词能力**:Sphinx内置了MMSEG中文分词器,能够有效地对中文文本进行分词处理,从而提升中文搜索的准确性和效率。此外,还有专门为中文优化的版本——Coreseek。 #### 三、Sphinx的优势与局限性 **...
2. **高速搜索**:在 2-4GB 的文本量中,平均查询速度不到 0.1 秒。 3. **高可用性**:单 CPU 可支持高达 100GB 的文本和 100M 文档。 4. **良好的相关性排名**:支持复杂的排名算法,确保搜索结果的相关性。 5. **...
- **Coreseek** 是一个基于Sphinx开发的中文全文检索/搜索软件,以GPLv2许可协议开源发布。它专为中文搜索和信息处理领域设计,广泛应用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据...
Sphinx中文广播模型的应用场景广泛,包括但不限于新闻转录服务、语音助手、智能音箱和车载导航系统等。通过持续的优化和更新,Sphinx可以更好地服务于中文语音识别的需求,促进人机交互的智能化。
Sphinx 支持多种数据源,如 MySQL,允许开发者将搜索功能无缝集成到现有的数据库系统中。 ### 一、XX网搜索引擎架构设计 1. **搜索引擎架构图**:基于 PHP+MySQL+Sphinx 的架构,主要由三部分组成:前端用户界面...
SphinxSE是一个专门用于MySQL的存储引擎,能够将Sphinx集成到MySQL中,实现高效的全文搜索。 **6.2 安装SphinxSE** - **在MySQL5.0.x上编译SphinxSE** - **在MySQL5.1.x上编译SphinxSE** 安装过程中需确保MySQL...
它的核心优势在于其高速的索引构建能力(可达10MB/s)和高效的搜索性能(在2-4GB的文本量中平均查询速度不到0.1秒)。Sphinx支持分布式搜索,能处理大量数据(单CPU支持最大100GB文本和100万条记录),并且提供优秀...
总的来说,Sphinx/Coreseek权威手册中文版是一本详尽的指南,涵盖了从安装、配置到开发和优化的全过程,是理解和使用Sphinx/Coreseek进行全文检索的宝贵资源。无论你是初学者还是经验丰富的开发者,都能从中受益匪浅...
Sphinx 是一个高性能的全文搜索引擎库,常用于构建复杂、高效的全文检索系统。它支持实时索引、布尔运算符、短语搜索、拼写检查、近似搜索等多种功能,广泛应用于网站、数据库和各种信息系统的搜索功能。在使用 ...
它支持多种语言,包括但不限于英语、俄语、中文等。Sphinx的核心优势在于其高效的搜索速度和灵活的搜索功能。 #### 三、下载与安装 1. **下载Sphinx for Chinese** - 版本:sphinx-for-chinese-2.2.1-dev-r4311-...