`
wangking717
  • 浏览: 263245 次
  • 性别: Icon_minigender_2
  • 来自: 成都
社区版块
存档分类
最新评论

【全文检索】Centos 6.5下使用Sphinx更好地进行MySQL搜索

 
阅读更多
wangking717写道
最近我的网站搜索功能变慢了,后来才发现是MySQL的LIKE来进行模糊查询引发的性能问题。
这个时候就需要用到Sphinx,我这里安装coreseek中文检索引擎,配置MySQL数据库访问接口,使用PHP程序实现中文检索。

 

1、安装编译工具

yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel

 

 

2、下载coreseek并且安装mmseg中文分词

下载http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz 到 /usr/local/src/
cd /usr/local/src
tar zxvf coreseek-3.2.14.tar.gz  #解压
cd coreseek-3.2.14
cd mmseg-3.2.14
./bootstrap    #输出的warning信息可以忽略,如果出现error则需要解决
./configure --prefix=/usr/local/mmseg3  #配置
make  #编译
make install  #安装

 

 

3、安装coreseek

cd /usr/local/src
cd coreseek-3.2.14
cd csft-3.2.14
sh buildconf.sh    #输出的warning信息可以忽略,如果出现error则需要解决
./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql  #配置
make  #编译
make install  #安装

 

 

4、创建测试数据库(test数据库和student表)

CREATE DATABASE test DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

CREATE TABLE `student` (  
   `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'ID',  
   `student_name` varchar(100) DEFAULT NULL COMMENT '姓名',  
   PRIMARY KEY (`id`)  
 ) ENGINE=MyISAM AUTO_INCREMENT=0 DEFAULT CHARSET=utf8 CHECKSUM=1 DELAY_KEY_WRITE=1 ROW_FORMAT=DYNAMIC;

INSERT INTO student (student_name) VALUES ('王琨');
INSERT INTO student (student_name) VALUES ('刘杰');
INSERT INTO student (student_name) VALUES ('王希');
INSERT INTO student (student_name) VALUES ('邓紫元');

 

 

5、对coreseek进行配置

cp  /usr/local/src/coreseek-3.2.14/testpack/etc/csft_mysql.conf  /usr/local/coreseek/etc/csft_mysql.conf  #拷贝MySQL数据源配置文件
vim /usr/local/coreseek/etc/csft_mysql.conf
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

source mySource
{
type                   = mysql
sql_host             = localhost
sql_user             = root  #账号
sql_pass             =666666 #密码
sql_db                 = test  #MySQL数据库名称
sql_port               = 3306
sql_query_pre     = SET NAMES utf8
sql_query      = SELECT id, student_name FROM student #sql_query第一列id需为整数
#student_name作为字符串/文本字段,被全文索引
sql_query_info_pre      = SET NAMES utf8                   #命令行查询时,设置正确的字符集
sql_query_info            = SELECT * FROM student WHERE id=$id #命令行查询时,从数据库读取原始数据信息
}

#index定义
index myIndex
{
source            = mySource             #对应的source名称
path            = /usr/local/coreseek/var/data/my_index
docinfo            = extern
mlock            = 0
morphology        = none
min_word_len        = 1
html_strip                = 0
#中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
charset_dictpath = /usr/local/mmseg3/etc
charset_type        = zh_cn.utf-8
}

#全局index定义
indexer
{
mem_limit            = 1024M  #内存使用限制
max_iops = 100
max_iosize = 0
}

#searchd服务定义
searchd
{
listen                  =   9312
read_timeout        = 5
max_children        = 30
max_matches            = 1000
seamless_rotate        = 0
preopen_indexes        = 0
unlink_old            = 1
pid_file = /usr/local/coreseek/var/log/searchd_mysql.pid
log =/usr/local/coreseek/var/log/searchd_mysql.log
query_log =/usr/local/coreseek/var/log/query_mysql.log
}

 

 

6、启动coreseek,建立索引

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf   #后台启动模式
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate  #建立索引服务
/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf  --stop  #停止
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate  #更新索引服务

 

7、使用PHP来测试全文中文检索

cp  /usr/local/src/coreseek-3.2.14/testpack/api/sphinxapi.php /var/www/html/sphinxapi.php #把API拷贝到Apache根目录
cp  /usr/local/src/coreseek-3.2.14/testpack/api/test_coreseek.php  /var/www/html/test.php  
cd /var/www/html/
vim test.php
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

<?php
//注意文件的编码格式需要保存为为UTF-8格式
require ( "sphinxapi.php" );
$cl = new SphinxClient ();
$cl->SetServer ( '127.0.0.1', 9312);
//以下设置用于返回数组形式的结果
$cl->SetArrayResult ( true );
/*
//ID的过滤

$cl->SetIDRange(3,4);
//sql_attr_uint等类型的属性字段,需要使用setFilter过滤,类似SQL的WHERE group_id=2
$cl->setFilter('group_id',array(2));
//sql_attr_uint等类型的属性字段,也可以设置过滤范围,类似SQL的WHERE group_id2>=6 AND group_id2<=8
$cl->SetFilterRange('group_id2',6,8);
*/

//取从头开始的前20条数据,0,20类似SQl语句的LIMIT 0,20

$cl->SetLimits(0,20);

//在做索引时,没有进行 sql_attr_类型 设置的字段,可以作为“搜索字符串”,进行全文搜索
$res = $cl->Query ( '搜索字符串', "*" );    //"*"表示在所有索引里面同时搜索,"索引名称(例如test或者test,test2)"则表示搜索指定的
//如果需要搜索指定全文字段的内容,可以使用扩展匹配模式:
//$cl->SetMatchMode(SPH_MATCH_EXTENDED);
//$res=cl->Query( '@title (测试)' , "*");
//$res=cl->Query( '@title (测试) @content ('网络')' , "*");

echo '<pre>';
print_r($res['matches']);
print_r($res);
print_r($cl->GetLastError());
print_r($cl->GetLastWarning());
echo '</pre>';

?>

 

最后访问http://localhost/test.php,就可以看到测试结果了。如果运行后,是空白的,则需要将防火墙关闭再去运行。

 

关闭防火墙:

1、关闭iptables
service iptables status #查看状态
service iptables stop

2、关闭selinux
/usr/bin/setstatus -v #查看状态
vim /etc/selinux/config
找到SELINUX 行修改成为:SELINUX=disabled
reboot #重启

 

 

文章参考:

1、http://www.coreseek.cn/

2、http://www.coreseek.cn/products-install/step_by_step/

3、http://www.coreseek.cn/products-install/mysql/

4、http://www.osyunwei.com/archives/7496.html

5、http://blog.csdn.net/e421083458/article/details/21529969

 

 

分享到:
评论

相关推荐

    CentOS6.5一键安装Mysql5.6

    在Linux系统中,CentOS 6.5是一个广泛使用的版本,而MySQL 5.6则是一个流行的开源数据库管理系统。本文将详细介绍如何在CentOS 6.5上进行MySQL 5.6的一键安装过程,包括必要的环境准备、安装步骤、配置优化以及安全...

    Centos6.5 镜像文件下载

    ### Centos6.5镜像文件下载与安装详解 #### 一、CentOS 6.5简介 CentOS是Community ENTerprise Operating System的...希望每位读者都能够顺利地完成CentOS 6.5的安装,并在此基础上搭建出符合自己需求的应用环境。

    centos 6.5配置mysql5.5

    本文将详细介绍如何在 CentOS 6.5 系统上安装 MySQL 5.5,并进行必要的配置,确保数据库服务的安全性和性能。 #### 一、准备工作 在开始安装之前,请确保已经更新了系统: ```bash sudo yum update ``` #### 二...

    如何升级CentOS 6.5下的MySQL

    本文将详细讲解如何在 CentOS 6.5 上安全地升级 MySQL。 首先,确保对现有数据库进行完整备份。使用`mysqldump`命令,提供相应的用户名(-u)、主机名(-h)、端口号(-P)和密码(-p),加上`--all-databases`参数...

    CentOs6.5镜像源

    CentOs6.5镜像源

    CentOS 6.5 最新可用的 Yum 源

    CentOS 6.5 的 软件源很多官方已经停止维护,该文件包内配置好的yum源是可以正常使用的。将原/etc/yum.repos.d/目录下原来的 .repo 备份, 然后把本文件包内的repo文件复制过去, yum clean all 后,再 yum ...

    CentOS6.5下CDH5.8.2本地包安装

    在CentOS6.5系统下安装CDH5.8.2,首先需要准备三台虚拟机,分别安装CentOS6.5系统。然后,需要修改主机名分别为hadoop01/hadoop02/hadoop03。修改主机名的方法有两种:一种是使用setup命令,另一种是修改vim /etc/...

    CentOS6.5的64位镜像文件iso,迅雷种子

    CentOS6.5的64位镜像文件iso。CentOS是基于linux内核而扩展的操作系统。

    CentOS6.5安装jdk,Tomcat,MYsql.doc

    总结起来,在CentOS 6.5上安装JDK、Tomcat和MySQL,涉及到了软件包管理器`yum`的使用,文件传输工具如`wget`,以及对系统服务的管理。理解并掌握这些步骤,将有助于你在Linux环境中快速搭建和管理Java Web服务。同时...

    CentOS 6.5 升级OpenSSH

    本文将详细讲解如何在CentOS 6.5系统上升级OpenSSH。 首先,升级OpenSSH通常涉及升级其依赖的库,特别是openssl。openssl是提供加密功能的核心库,新的版本通常会包含更强的加密算法和修复的安全漏洞。在升级...

    E3:用mysql安装包在CentOS6.5系统下安装和配置mysql.docx

    MySQL 在 CentOS 6.5 系统下的安装和配置 本文将指导用户在 CentOS 6.5 系统下安装和配置 MySQL 数据库管理系统。整个过程分为九个步骤,从卸载原有的 MySQL 到设置开机自启动。 步骤 1:卸载原有的 MySQL 在安装...

    CentOs 6.5 telnet 客户端 linux 64(离线安装)

    centos 6.5 telnet 客户端 安装文件 rpm包 centos 6.5 telnet 服务端 安装文件 rpm包 http://vault.centos.org/6.5/os/x86_64/Packages/ 从官网下载亲测可以用

    centos 6.5下安装文件上传下载服务

    centos 6.5下的文件上传下载服务安装和配置 centos 6.5下的文件上传下载服务是指在centos 6.5操作系统中安装和配置文件上传下载服务,以解决上传和下载文件的问题。这个服务可以让用户轻松地上传和下载文件,而不...

    VMware创建安装CentOS6.5(配截图)

    "VMware创建安装CentOS6.5(配截图)" VMware 是一款功能强大且流行的虚拟机软件,用户可以在 VMware 中创建多个虚拟机,每个虚拟机都可以独立运行不同的操作系统。CentOS6.5 是一个基于 Linux 的开源操作系统,...

    centos6.5安装mysql5.6

    在本文中,我们将详细探讨如何在CentOS 6.5系统上安装MySQL 5.6。...完成以上步骤后,MySQL 5.6已经在你的CentOS 6.5系统上运行,并准备好接受连接和数据管理。确保根据你的具体需求进一步调整配置和安全设置。

    CentOS6.5下YUM安装最新MySQL5.7.12(王三旗亲自整理,最简单明了)

    CentOS6.5下YUM安装最新MySQL5.7.12

    centos6.5安装教程,绝对详细,内附centos镜像等资源

    虚拟机是安装 CentOS 6.5 的一种常见方式,使用虚拟机可以方便地在物理机上运行多个操作系统。虚拟机安装需要下载相应的虚拟机软件和 CentOS 镜像文件。 1. 下载虚拟机软件 首先,需要下载虚拟机软件,例如 VMware...

    Centos6.5下安装Mysql5.7+的脚本及安装手册

    Centos6.5下安装Mysql5.7+的脚本及安装手册。 安装包需要从网上下载,我测试的安装包为mysql-5.7.10-linux-glibc2.5-x86_64.tar.gz,500多M,上传不了。注意:必须是二进制安装版的,不能是rpm或源码版的。 经我测试...

    U盘安装CentOS 6.5

    使用U盘安装CentOS 6.5可以跳过刻盘的步骤,速度也更快,而且没有硬件限制(新机器USB口都有,光驱不一定有)。 U盘安装CentOS 6.5的优点: 1. 不需要刻盘,速度快 2. 没有硬件限制(新机器USB口都有,光驱不一定...

Global site tag (gtag.js) - Google Analytics