一. 创建sphinx.conf文件
其结构组成主要如下:
Source 源名称1{ //指定数据源
一些配置
}
Index 索引名称1{
Source=源名称1
}
Source 源名称2{
一些配置
}
Index 索引名称2{
Source=源名称2
}
Indexer{
mem_limit = 32M
}
Searchd{ //配置 searchd 守护程序本身
}
二. Source 源名称 相关配置说明
Type=数据库类型(Mysql 或SQL);
Sql_host= 数据库主机地址(如果是外网,请确保防火墙允许链接)
Sql_user= 数据库用户名
Sql_pass= 数据库密码
Sql_db= 数据库名称
Sql_port= 数据库端口
Sql_query_pre= 执行SQL前设置的编码 (SET NAMES UTF8)
Sql_query= 全文检索要显示的内容,据官方说法:尽可能不要使用WHERE或GROUPBY ,将其交给SPHINX效率会更高;select 出来的字段必须包含至少一个唯一主键,以及全文检索的字段 sphinx 会对SELECT 中的 字段1 ,字段2 建立sphinx自己的索引 及 在查询的字段中查找关键字
Sql_query_info=
SELECT * FROM Inventory WHERE id=$id 来查找匹配记录 在查询中,$id
被替换为 searchd 返回的每个主键 (调试是使用 建议注释此项)
Strip_html= 0/1 是否去掉HTML标签
Sql_attr_uint= 无符号整数属性,可以设置多个,设置数据库字段,设置哪个能显示出哪个字段数据的整形来.
三. Index中配置说明
Source= 数据源名称
Path = 索引记录存放目录,注:d:/sphinx/data/cg 这个的意思是 在data目录下创建一个名为cg的文件
min_word_len= 索引的词的最小长度 设为1 既可以搜索单个字节搜索,越小 索引越精确,但建立索引花费的时间越长
charset_type= utf-8/gbk 设置数据编码
charset_table= 字符表和大小写转换规则 .频繁应用于sphinx的分词过程
min_prefix_len = 最小前缀(0)
min_infix_len = 最小中缀(1)
ngram_len = 对于非字母型数据的长度切割(默认已字符和数字切割,设置1为按没个字母切割)
四. searchd配置说明
port= sphinx的端口(9312 与 searchd.exe监听结果一致)
log= 服务进程日志存放路径,一旦sphinx出现异常,基本上可以从这里查询有效信息
query_log= 客户端查询日志 尤为有用 它将在运行时显示每次搜索并显示结果
read_timeout= 请求超时(5)
max_children= 同时可执行的最大searchd 进程数(30)
pid_file= 进程ID文件
max_matches= 查询结果的最大返回数
seamless_rotate= 是否支持无缝切换,做增量索引时通常需要(0/1)
# 在启动运行时是否提前加载所有索引文件
preopen_indexes = 0
# 是否释放旧的索引文件
unlink_old = 1
# MVA跟新池大小(默认为1M)
mva_updates_pool = 1M
# 最大允许的网络包大小(默认8M)
max_packet_size = 8M
# 每个查询最大允许的过滤器数量(默认256)
max_filters = 256
#每个过滤器最大允许的值的个数(默认4096)
max_filter_values = 4096
# 每个组的最大查询数(默认为32)
max_batch_queries = 32
至此 spninx.conf 配置文件结束;注意:如果有换行 必须用反斜杠 \ 链接
五. sphinx建立所以 及监听
切换到 DOS sphinx/bin 目录下
1. 建立索引
Indexer –c sphinx.conf 索引名称/–all (–all参数是建立所有索引)
完成后提示如下:
total 535600 docs, 10707632 bytes
total 34.323 sec, 311958 bytes/sec, 15604.27 docs/sec
total 5 reads, 0.282 sec, 45592.6 kb/call avg, 56.4 msec/call avg
total 547 writes, 12.172 sec, 1017.0 kb/call avg, 22.2 msec/call avg
2. 建立完成后
可以执行 search [–c] sphinx.conf 搜索内容 (-c参数:是否允许模糊搜索)
3. 监听端口
Searchd
运行后 提示
listening on all interfaces, port=9312
accepting connections
监听成功后 既可以运行PHP程序 进行 搜索
PHPCODE:
require(“sphinxapi.php”); //加载类文件
$cl=new SphinxClient(); //实例化类
$cl->SetServer(‘localhost’,9312); //设置服务
$cl->SetArrayResult(true); //设置 显示结果集方式
$cl->SetLimits(0,10); //同 sql语句中的LIMIT
$cl->SetSortMode(“mode”); //排序模式 SPH_SORT_ATTR_DESC和SPH_SORT_ATTR_ASC
$result=$cl->Query(‘ff’,[索引名称可选]); //执行搜索
Var_dump($result); //输出
注意:每次修改sphinx.conf后要重建索引.
相关推荐
本资源提供了关于Sphinx配置的详细说明,帮助用户更好地理解和使用这个工具。 1. **Sphinx的基本概念** - Sphinx是一个基于Python的文档生成框架,它通过解析源文件(通常是`.rst`文件)来构建和渲染文档。 - ...
5. **配置Sphinx**:在Sphinx的配置文件`sphinx.conf`中设置数据源、索引、搜索日志等相关参数,并启用中文处理模块。 6. **创建索引**:使用Sphinx的`indexer`工具对数据源进行索引,此时会调用XDict进行中文分词...
3、创建Sphinx配置文件 13 4、初始化sphinx.conf中配置的全部索引 13 5、创建两个shell脚本,一个用来创建主索引、一个用来创建增量索引。 13 ⑴、主索引更新脚本 13 ①、创建脚本build_main_index.sh: 13 ②、赋予...
Sphinx-4的配置文件(通常是config.xml)需要根据项目需求进行适当修改,包括设置声学模型、语言模型以及麦克风设备等。 【声学模型与语言模型】 声学模型是Sphinx-4的核心组成部分,它将音频信号映射到发音单元...
压缩包中的`sphinx`文件夹可能包含了Sphinx的安装文件、配置文件、示例代码或者其他的辅助文件。解压后,用户应按照说明进行安装和配置,包括启动Sphinx服务、测试连接以及运行示例查询。 7. **实践应用**: 在...
6. **配置文件`conf.py`**:每个Sphinx项目都有一个配置文件,用于设置全局选项,如源文件路径、输出目录、语言设置、链接检查等。 7. **构建过程**:使用`sphinx-build`命令行工具,用户可以方便地编译文档,监控...
- 将编译后的`searchd`和`sphinx.conf`配置文件放置到服务器合适的位置,并编辑`sphinx.conf`,配置索引路径、端口、日志文件等相关参数。 2. **CoreSeek 3.1的安装**: - CoreSeek是Sphinx的中文版,增强了对...
接着,你需要创建一个 Sphinx 项目,这通常涉及到在项目根目录下创建一个名为 `docs` 的子目录,并在其中初始化配置文件 `conf.py`。这个配置文件用于设定文档构建的全局选项,如主题、输出目录、扩展等。 2. **...
为了使用这个主题,用户需要将它添加到Sphinx的配置文件(`conf.py`)中,并指定为活跃主题。 总的来说,`sphinx-bootstrap-theme-0.4.0.tar.gz`是Sphinx文档系统的一个扩展,它允许开发者利用Bootstrap的灵活性和...
通过以上介绍,我们可以了解到Coreseek Sphinx在全文搜索领域的强大功能,以及如何通过提供的API和示例文件在实际项目中应用这些功能。在实际开发过程中,根据项目需求调整配置和代码,可以构建出高效、智能的搜索...
7. Serialization builder details(序列化构建器细节)、Available builders(可用构建器)和The build configuration file(构建配置文件):文档的这些部分可能涵盖了更多高级主题,比如项目信息、通用配置选项、...
Sphinx 的主要配置文件是`conf.py`,它定义了文档的全局设置,如源代码目录、输出目录、主题选择、语言设置等。在`conf.py`中,你可以配置`language = 'zh_CN'`来指定使用中文语言。 3. **文档结构** Sphinx 文档...
3. COPYING.LIBSPHINXCLIENT 可能是关于 Sphinx 客户端库的许可协议,详细说明了该库的使用、复制和分发条款。 4. LICENSE 文件应该包含 PHP Sphinx 扩展本身的许可信息,可能是 PHP 的通用公共许可证(PHP License...
2. **配置文件**:用于设置识别参数,例如语言模型、声学模型、字典等,这些参数影响识别的准确性和速度。 3. **训练数据**:包含大量的语音样本和对应的转录文本,用于训练声学模型和语言模型。 4. **工具和脚本**...
从压缩包子文件的文件名称列表来看,只有一个文件名`sphinx_aimms_theme-0.1.32`,这通常意味着它是一个包含了项目源代码、配置文件、README等资源的顶级目录。要了解这个主题的具体功能和用法,我们需要解压这个...
3. **创建Sphinx配置文件**:定义Sphinx的工作模式、数据源和索引策略。 4. **初始化sphinx.conf中配置的全部索引**:确保索引与配置一致,为搜索服务做好准备。 5. **创建索引更新脚本**:通过自动化脚本定期重建...
标题 "PyPI 官网下载 | sphinx-stylo-0.1.0.tar.gz" ...为了开始使用`sphinx-stylo`,开发者需要先在本地环境中安装它,可以通过运行`pip install sphinx-stylo`来完成,然后在Sphinx配置文件中引入并配置这个扩展。
这个项目不仅包含了完整的源代码,还附带了程序使用说明和配置文件,方便用户理解和部署。 1. **Python基础**:本项目的基础是Python编程语言,Python以其简洁易读的语法和丰富的库支持在开发领域广泛应用,特别...