002 # Minimal Sphinx configuration sample (clean, simple, functional)
003 #
004 source wp_posts
005 {
006 # data source type. mandatory, no default value
007 # known types are mysql, pgsql, mssql, xmlpipe, xmlpipe2, odbc
008 type = mysql
009 #####################################################################
010 ## SQL settings (for 'mysql' and 'pgsql' types)
011 #####################################################################
012
013 # some straightforward parameters for SQL source types
014 sql_host = localhost
015 sql_user = root
016 sql_pass = root
017 sql_db = test
018 sql_port = 3306 # optional, default is 3306
019
020 #待索引数据获取前查询
021 sql_query_pre = SET NAMES utf8
022 sql_query_pre = SET SESSION query_cache_type=OFF
023
024
025 sql_query = selectID,post_content,post_title,post_name,guid,UNIX_TIMESTAMP(post_date) post_date \
026 from wp_posts
027
028 #sql_field_string = post_title
029 #sql_field_string = post_content
030 sql_attr_timestamp = post_date
031 #sql_query_info = select * from wp_posts where ID=$id
032 }
033 index wp_posts
034 {
035 source = wp_posts
036 path = /home/coreseek/data/59n_posts
037 docinfo = extern
038 charset_dictpath = /usr/local/mmseg3/etc/
039 charset_type = zh_cn.utf-8
040 }
041
042 ########增量索引,进行实时更新
043
044 source wp_posts_rt:wp_posts
045 {
046 sql_query = selectID,post_content,post_title,post_name,guid,UNIX_TIMESTAMP(post_date) \
047 post_date \
048 from wp_posts where UNIX_TIMESTAMP(post_modified) > UNIX_TIMESTAMP() - 300
049 }
050 index wp_posts_rt
051 {
052 source = wp_posts_rt
053 path = /home/coreseek/data/59n_posts_rt
054 docinfo = extern
055 charset_dictpath = /usr/local/mmseg3/etc/
056 charset_type = zh_cn.utf-8
057 }
058
059
060 source wp_comment
061 {
062 type = mysql
063 sql_host = localhost
064 sql_user = root
065 sql_pass = root
066 sql_db = test
067 sql_port = 3306 # optional, default is 3306
068 #待索引数据获取前查询
069 sql_query_pre = SET NAMES utf8
070 sql_query_pre = SET SESSION query_cache_type=OFF
071
072
073 sql_query = selectcomment_ID,comment_post_ID,comment_author,comment_content,UNIX_TIMESTAMP(comment_date) comment_date from wp_comments
074
075 sql_attr_uint = comment_post_ID
076 #sql_field_string = comment_author
077 #sql_field_string = comment_content
078
079 sql_attr_timestamp = comment_date
080 #sql_query_info = select * from wp_comments where comment_ID=$id
081 }
082
083
084
085 index wp_comment
086 {
087 source = wp_comment
088 path = /home/coreseek/data/59n_comment
089 docinfo = extern
090 charset_dictpath = /usr/local/mmseg3/etc/
091 charset_type = zh_cn.utf-8
092 }
093
094 ########增量索引,进行实时更新
095
096 source wp_comment_rt:wp_comment
097 {
098 sql_query = selectcomment_ID,comment_post_ID,comment_author,comment_content,UNIX_TIMESTAMP(comment_date) comment_date from wp_comments \
099 where UNIX_TIMESTAMP(comment_date) > UNIX_TIMESTAMP() - 300
100 }
101 index wp_comment_rt
102 {
103 source = wp_comment_rt
104 path = /home/coreseek/data/59n_comment_rt
105 docinfo = extern
106 charset_dictpath = /usr/local/mmseg3/etc/
107 charset_type = zh_cn.utf-8
108 }
109
110 indexer
111 {
112 mem_limit = 256M
113 }
114
115
116 searchd
117 {
118 listen = 9312
119 listen = 9306:mysql41
120 log = /usr/local/coreseek/var/log/searchd.log
121 query_log = /usr/local/coreseek/var/log/query.log
122 read_timeout = 5
123 max_children = 10
124 pid_file = /usr/local/coreseek/var/log/searchd.pid
125 max_matches = 1000
126 seamless_rotate = 1
127 preopen_indexes = 1
128 unlink_old = 1
129 workers = threads # for RT to work
130 }
进行首次索引
./bin/indexer --all
使用crontab -e进行增量索引进行实时更新
*/4 * * * * /usr/local/coreseek/bin/indexer --rotate wp_posts_rt wp_comment_rt
*/4 * * * * /usr/local/coreseek/bin/indexer --rotate --merge wp_posts wp_posts_rt
*/4 * * * * /usr/local/coreseek/bin/indexer --rotate --merge wp_comment wp_comment_rt
在PHP中使用sphinx扩展进行搜索.
1 $sp = new SphinxClient();
2 $sp->setMatchMode(SPH_MATCH_ANY);
3 $result = $sp->query($name);
4 //$err 错误
5 $err = $sp->GetLastError();
6 echo '<pre>';
7 var_dump($result);
8 var_dump($err);
9 echo '</pre>';
分享到:
相关推荐
**Coreseek 全文搜索服务器2.5**是一款基于开源全文搜索引擎Sphinx进行修改和增强的产品,它在原生Sphinx的基础上提供了更多的功能和优化,旨在为企业和开发者提供更高效、更灵活的全文检索解决方案。在GPL协议下,...
《Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册》详述了Coreseek全文检索服务器的核心功能、安装配置、索引建立、搜索机制以及API接口等内容,旨在帮助用户深入理解和高效使用该服务器。 1. **简介** - **...
今天wordpress教程网跟大家分享下如何在wordpress中使用高效的全文索引组件coreseek。Coreseek开源中文检索引擎,可以说是Sphinx中文版,因为coreseek加入了中文分词库,大家可以到官网去查看具体介绍:...
Coreseek发布了3.2.14版本和4.1版本,其中的3.2.14版本是2010年发布的,它是基于Sphinx0.9.9搜索引擎的。而4.1版本是2011年发布的,它是基于Sphinx2.0.2的。Sphinx从0.9.9到2.0.2还是有改变了很多的,有很多功能,...
2. **Coreseek全文检索引擎**:Coreseek是一个开源的全文检索解决方案,它基于Sphinx搜索引擎,具有高速度和易于扩展的特点。它通常用于构建高性能的全文检索系统。 3. **Python**:Python是一种广泛使用的高级编程...
Sphinx和CoreSeek是两种强大的全文搜索引擎技术,尤其在处理大量数据的检索和高效率搜索时表现卓越。它们常被用于网站、数据库和其他需要快速、精确搜索功能的应用中。本文将详细介绍如何在Linux环境中安装和配置...
coreseek mysql 索引配置文件 增量索引
"coreseek搜索服务1"是一个关于使用CoreSeek搭建和优化搜索服务的主题。CoreSeek是一款开源的全文搜索引擎,它集成了Sphinx搜索服务器和中文分词器,为用户提供高效、精准的全文检索功能。在IT领域,全文搜索引擎...
CoreSeek站内搜索是一款强大的开源搜索引擎,专为中文环境设计,提供高效、可扩展的全文检索功能。它结合了Sphinx搜索引擎的特性,并且支持与MySQL数据库紧密集成,使得数据检索和管理变得更加便捷。在本篇文章中,...
Coreseek是一款基于Sphinx搜索引擎的中文分词系统,它提供了强大的全文检索功能,广泛应用于各种数据索引和搜索场景。本文将详细介绍如何在Linux环境下编译安装Coreseek 4.1版本,并进行实时索引的配置。 首先,...
CoreSeek是一款开源的全文搜索引擎服务器,它提供了强大的信息检索功能,并且可以方便地与各种数据库、应用程序集成。在CoreSeek3.1.14版本中,我们主要关注以下几个关键知识点: 1. **核心组件**:CoreSeek的核心...
在MySQL的基础上,CoreSeek融入了Sphinx全文索引引擎,使得对中文文本的检索性能得到了显著提升,尤其适合处理大量中文数据的搜索需求。 **1. CoreSeek的核心特性** CoreSeek的核心在于其内置的Sphinx全文索引引擎...
CoreSeek是一款基于Sphinx搜索引擎的开源全文搜索解决方案,主要用于提供高效、精确的全文检索功能。在这款软件的3.2.14版本中,我们能够深入探讨关于Sphinx搜索引擎、CoreSeek的特点以及如何在项目中应用这些技术。...
"coreseek-3.2.14-win32" 是一个针对Windows平台的中文全文搜索引擎软件,它是基于开源项目Sphinx的扩展版本。Sphinx是一款强大的、高性能的信息检索服务系统,常用于构建高效的搜索功能。在处理英文文本时,Sphinx...
Coreseek的核心是基于Sphinx搜索引擎,Sphinx是一款高性能、可配置的全文检索引擎,尤其在处理大量数据时表现突出。它支持多种数据库,如MySQL、PostgreSQL等,可以与这些数据库进行实时索引,实现快速查询。Sphinx...
Coreseek Fulltext Server 是一款开源的全文搜索引擎,专为中文环境设计,提供了强大的全文检索功能。这款服务器软件的源代码开放,允许开发者深入研究其内部机制,为自己的项目进行定制或优化。在搜索引擎领域,...
Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...
Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等...
CoreSeek是一款基于Sphinx搜索引擎的开源全文检索解决方案,它在中国的开源社区中有着广泛的应用。本教程将深入探讨2014年12月24日版本的CoreSeek demo,以及与其密切相关的Sphinx搜索引擎的核心概念和技术。 一、...
Coreseek是一款基于Sphinx搜索引擎技术的中文全文检索引擎软件,主要应用于大数据量的全文搜索解决方案。这个"coreseek-3.2.13.tar.gz"文件是一个Linux/Unix平台下的压缩包,包含了Coreseek 3.2.13版本的所有源代码...