对于一般的数据库全文搜索应用,sphinx还是非常好用的。
搜了几篇文章,对中文的搜索基本上可以归结为2种方法
1,使用coreseek.cn的修改版. 支持中文的分词索引
2,blog.s135.com的方法,中文使用一元索引。在查询分析的时候,再使用中文分词,将词组写在查询语法里。这种方法比较简单,不hack原代码,而且分词也可以选择自己熟悉的方式。不过只支持utf8.(这样才能把单个汉字分出来建索引)
配置成功,记录下来
#
# Minimal Sphinx configuration sample (clean, simple, functional)
#
# 索引源 和 索引配置
source ts_ask
{
type = mysql
sql_host = 127.0.0.1
sql_user = root
sql_pass =
sql_db = kmp
sql_port = 3306
sql_query_pre = SET NAMES utf8
sql_query = SELECT askId,uid,uname,title,infoId,cTime,readCount,status,type,digCount FROM ts_ask
sql_attr_timestamp = cTime
sql_attr_uint = uid
sql_attr_uint = readCount
sql_query_info = SELECT * FROM ts_ask WHERE askId=$id
}
index ts_ask
{
source = ts_ask
path = E:/sphinx/index/ts_ask
docinfo = extern
mlock = 0
morphology = none
html_strip = 1
min_word_len = 1
charset_type = utf-8
charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
ngram_len = 1
ngram_chars = U+3000..U+2FA1F
}
# 全局配置
indexer
{
mem_limit = 32M
}
searchd
{
address = 127.0.0.1
port = 3312
log = E:/sphinx/log/searchd.log
query_log = E:/sphinx/log/query.log
read_timeout = 5
max_children = 30
pid_file = E:/sphinx/log/searchd.pid
max_matches = 1000
# seamless_rotate = 0
preopen_indexes = 0
unlink_old = 1
}
分享到:
相关推荐
windows 下 sphinx 增量索引配置文件 mssql
介绍sphinx实时索引的特点和工作机制
`sphinx.conf`是Sphinx的主要配置文件,包含了索引定义、源设置、搜索守护进程(searchd)配置、网络接口设定等。例如,你可以定义一个索引名为`test_index`,指定数据源(如MySQL),设置索引字段、分词器、排序...
此外,相关的扩展阅读文章提到了Coreseek(Sphinx的中文版)、Sphinx的安装、配置以及使用示例,还涵盖了如何将Sphinx与MySQL结合进行多线程搜索、生成PDF文档,以及在PHP中启用Sphinx全文搜索的方法,这些都是...
2. Sphinx的配置文件(如`searchd.conf`和`sphinx.conf`)是否正确设置了数据库连接参数和索引配置。 3. PHP代码中与Sphinx交互的部分是否有语法错误或逻辑问题。 4. 检查服务器资源,确保内存和CPU足够处理索引更新...
在Yii框架中,sphinx索引配置是一个重要环节,它可以帮助开发者快速实现数据的全文搜索功能。为了深入解析Yii框架中sphinx索引配置的具体方法,以下内容将详细介绍配置步骤与操作技巧。 首先,要进行sphinx索引配置...
Sphinx 是一个高性能全文搜索引擎,尤其适用于需要实时更新索引的应用场景。它的核心特性包括高效、灵活的配置以及对多种数据源的支持。在本篇文章中,我们将深入探讨 Sphinx 的实时索引(Real-Time Indexing)功能...
在实际应用中,Sphinx 还支持增量索引和实时更新,这意味着当数据源发生变化时,索引可以只更新新增或修改的部分,而无需重新构建整个索引,从而保持搜索服务的高效性和数据的最新性。例如,"sphinx增量索引的一个...
2. **配置Sphinx**: 修改`sphinx.conf`配置文件,设置数据源(通常是MySQL)、索引定义、搜索监听端口等参数。对于中文支持,需要配置charset_type为`utf-8`,并使用适合中文分词的词典,例如`dict=cpphash`或`dict=...
**Sphinx+CoreSeek安装配置指南** ...总结,Sphinx+CoreSeek的安装配置涉及到多个步骤,包括源码编译、配置文件修改、索引创建和更新、PHP接口的集成。通过正确配置和使用,可以实现高效的全中文搜索引擎功能。
Sphinx是一个基于SQL的全文检索引擎,可以结合...Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。
- 定期监控和优化索引性能,调整索引配置以适应数据变化。 总的来说,Sphinx是构建高效全文搜索的重要工具,结合PHP的使用,可以轻松集成到Web应用中,提供快速、精准的搜索体验。通过深入学习和实践,你可以掌握...
配置Sphinx通常涉及编辑`sphinx.conf`文件,设置数据源、索引、搜索服务等参数。在Java应用中,可能还需要配置连接参数,如主机名、端口、索引名称等。为了方便起见,将Sphinx安装在`D:/develop/`目录下可以避免...
Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。 Sphinx的主要特性包括:高速索引 (在新款CPU...
4. **配置Sphinx**:编辑`sphinx.conf`配置文件,设定数据源、索引、搜索日志等相关参数。 5. **启动Sphinx**:通过命令行启动Sphinx守护进程。 ### 四、Sphinx与MySQL的集成 1. **创建数据源**:在`sphinx.conf`...
Sphinx是一个基于SQL的全文检索引擎,可以结合...Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。
Sphinx是一个基于SQL的全文检索引擎,可以结合...Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。
6. **测试和优化**:进行实际搜索测试,根据效果调整索引配置和搜索算法,以达到最佳效果。 **总结** 结合Sphinx的全文检索功能和Discuz! 的社区管理平台,可以为用户提供更高效、准确的搜索体验。通过深入理解...