`

(转)sphinx安装配置手记

阅读更多
http://www.54chen.com/architecture/sphinx-install-and-configure-notes.html

出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索系统。
下载
wget http://www.coreseek.cn/uploads/csft/3.2/csft-3.2.12.tar.gz
wget http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.12.tar.gz
解压
tar -zxvf mmseg-3.2.12.tar.gz
tar -zxvf csft-3.2.12.tar.gz
中文依赖下载和安装
wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.13.tar.gz
tar zxvf libiconv-1.13.tar.gz
cd libiconv-1.13/
./configure –with-libiconv-prefix
make
make install
建立系统动态链接
在/etc/ld.so.conf中加一行/usr/local/lib,运行ldconfig。 ld.so.conf和ldconfig是维护系统动态链接库的。真不明白为什么iconv库安装时不把这一步也做了
安装mmseg分词
cd mmseg-3.2.12
yum -y install glibc-common libtool autoconf automake mysql-devel expat-devel
aclocal
libtoolize –force
automake –add-missing
autoconf
autoheader
./configure –prefix=/usr/local/mmseg3
make
make install
cp -f src/*/*.h /usr/local/mmseg3/include/mmseg/
安装sphinx
cd ..
cd csft-3.2.12
aclocal
libtoolize –force
automake –add-missing
autoconf
autoheader
perl -pi -e ’s/lpthread/lpthread -liconv/g’ src/Makefile*
./configure –prefix=/usr/local/coreseek –enable-id64 –without-python –with-mysql –with-mmseg –with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ –with-mmseg-libs=/usr/local/mmseg3/lib/
perl -pi -e ’s/lpthread/lpthread -liconv/g’ src/Makefile*
make
make install
cd /usr/local/coreseek/etc/
cp sphinx.conf.dist csft.conf
修改配置中文支持
vim csft.conf
找到charset_type行,修改为:
charset_dictpath = /usr/local/coreseek/dict/
charset_type = zh_cn.utf-8
生成字典:
cd /root/install/mmseg-3.2.12/data/
/usr/local/mmseg3/bin/mmseg -u unigram.txt
mkdir -p /usr/local/coreseek/dict/
mv unigram.txt.uni /usr/local/coreseek/dict/uni.lib
增加mmseg配置:
vim /usr/local/coreseek/dict/mmseg.ini
mmseg.ini配置:(请将其放置到词典文件uni.lib所在的目录,并在文件结尾空两行)
[mmseg]
merge_number_and_ascii=0; ;合并英文和数字 abc123/x
number_and_ascii_joint=-; ;定义可以连接英文和数字的字符
compress_space=1; ;暂不支持
seperate_number_ascii=0; ;就是将字母和数字打散
索引
touch /data/exceptions.txt
bin/indexer –all
搜中文

分享到:
评论

相关推荐

    sphinx 安装及使用

    #### 二、Sphinx安装步骤 **1. 下载Sphinx** - 访问官方下载页面:[http://sphinxsearch.com/downloads/release/](http://sphinxsearch.com/downloads/release/),选择适合的版本进行下载。 **2. 解压安装包** -...

    sphinx+coreseek安装配置

    **Sphinx+CoreSeek安装配置指南** Sphinx和CoreSeek是两种强大的全文搜索引擎技术,尤其在处理大量数据的检索和高效率搜索时表现卓越。它们常被用于网站、数据库和其他需要快速、精确搜索功能的应用中。本文将详细...

    sphinx在linux的安装和使用方法

    除了安装和配置Sphinx外,我们还需要考虑如何将其集成到现有的应用中。对于基于PHP的应用,可以使用`php-sphinx`扩展来实现Sphinx的查询功能。 ##### 3.1 安装php-sphinx扩展 ```bash pecl install sphinx ``` ...

    Windows下安装使用Sphinx

    ### Windows 下安装使用 Sphinx #### 一、Sphinx 概述 Sphinx 是一款由俄罗斯开发者 Andrew Aksyonoff 开发的高性能全文搜索软件包,它支持 GPL 和商业许可协议。全文检索是一种信息检索技术,它以文档的全部文本...

    sphinx+mysql 安装手册

    本手册将详细讲解如何在生产环境中安装和配置Sphinx以及与MySQL的集成。 ### 一、Sphinx简介 Sphinx提供实时索引、低延迟查询、布尔运算、短语搜索以及同义词支持等功能,适合于大数据量的搜索引擎应用。其主要...

    sphinx+xdict+安装说明.zip

    4. **编译与安装**:进入Sphinx源码目录,执行配置脚本,配置过程中要确保选择安装中文支持。然后进行编译和安装,这个过程可能需要安装一些额外的依赖,如libxml2和libxslt。 5. **配置Sphinx**:在Sphinx的配置...

    sphinx 的安装及使用 windws centos coreseek

    在描述中提到了一个博文链接,虽然具体内容没有给出,但可以推测博主“sinykk”分享了他在安装和配置Sphinx以及与Coreseek集成过程中的经验。由于没有实际的博文内容,我将基于一般流程来解释Sphinx的安装和使用。 ...

    php7的sphinx扩展,适用linux,mac

    3. 编译并安装扩展:运行`phpize`来配置编译环境,然后执行`./configure --with-sphinx=/path/to/sphinx`,最后使用`make && make install`完成编译和安装。 4. 更新PHP配置:将新安装的Sphinx扩展添加到php.ini文件...

    Linux下Mysql5.5的Cmake安装以及sphinx结合

    #### 二、Sphinx的安装与配置 ##### 1. 解决动态库问题 在安装Sphinx时可能会遇到动态库加载的问题。 ```shell echo "/usr/local/mysql/lib/" >> /etc/ld.so.conf ldconfig ``` ##### 2. 解压Sphinx源码包 下载...

    windows 下 mssql sphinx 增量索引配置文件

    windows 下 sphinx 增量索引配置文件 mssql

    rails3 和 thinking_sphinx安装

    总结一下,Rails3 和 Thinking_Sphinx 的集成涉及安装 Sphinx、配置 Thinking_Sphinx、定义索引、构建索引、启动搜索守护进程以及在应用中使用搜索方法。通过这种方式,你可以为你的 Rails 应用程序引入强大的全文...

    window 下sphinx 2.2.11安装 及coreseek3.1 安装包及安装说明 ,简单php调试

    - 将编译后的`searchd`和`sphinx.conf`配置文件放置到服务器合适的位置,并编辑`sphinx.conf`,配置索引路径、端口、日志文件等相关参数。 2. **CoreSeek 3.1的安装**: - CoreSeek是Sphinx的中文版,增强了对...

    Sphinx 在 windows 下安装使用.docx

    【Sphinx 在 Windows 下安装使用】的文档主要涵盖了在Windows操作系统上安装和配置Sphinx全文检索引擎的过程。Sphinx是一个高性能、开源的全文搜索引擎,它提供了多种编程语言的API,如PHP、Python、Perl和Ruby,...

    Sphinxbase & Pocketsphinx 安裝說明

    ### Sphinxbase与Pocketsphinx安装指南 #### 一、引言 Sphinxbase与Pocketsphinx作为开源语音识别工具包,在语音技术领域有着广泛的应用。本文档将详细介绍这两个工具包的安装过程,帮助读者顺利搭建语音识别环境。...

    sphinx配置文件

    全文搜索配置## 命令行获取信息查询。 ## 我们进行索引一般只会返回主键id,而不会返回表中的所有字段。 ## 但是在调试的时候,我们一般需要返回表中的字段,那这个时候,就需要使用sql_query_info。 ## 同时这个...

    java 整合 sphinx

    为了方便起见,将Sphinx安装在`D:/develop/`目录下可以避免路径问题,使得配置文件中的路径设置更为直观。 5. **Java查询**: Java查询Sphinx可以通过`sphinx4j`库提供的API进行。这包括建立连接、发送查询请求、...

Global site tag (gtag.js) - Google Analytics