其实是添加中文分词后进行中文搜索coreseek中的sphinx.conf文件配置
source src2
{
type = mysql
sql_host = 127.0.0.1 // 数据库地址
sql_user = admin //用户名
sql_pass = admin //密码
sql_db = mydb
sql_port = 3306 # optional, default is 3306
sql_sock = /tmp/mysql.sock //数据库在linux服务器需开启
sql_query_pre = SET NAMES utf8 //字符编码
sql_query_pre = SET SESSION query_cache_type=OFF
sql_query = \
SELECT id, gid, addtime AS date_added, realname \
FROM order_admin
sql_attr_uint = gid
sql_attr_timestamp = date_added
sql_ranged_throttle = 0
sql_query_info = SELECT * FROM order_admin WHERE id=$id
}
source src2throttled : src2 //为增量索引设置
{
sql_ranged_throttle = 100
sql_query = \
SELECT id, gid, addtime AS date_added, realname \
FROM order_admin
}
index test2
{
source = src2
path = /usr/local/webserver/coreseek/var/data/test2
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
charset_type = zh_cn.utf-8
charset_dictpath =/usr/local/mmseg/etc/
# 'utf-8' default value is
# charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
html_strip = 0
}
//indexer 和searchd 可以默认 如果有需要监听的数据库ip可以在searchd设置
index test2stemmed : test2 //增量索引设置
{
source = src2throttled
path = /usr/local/webserver/coreseek/var/data/test2stemmed
morphology = stem_en
}
每次修改完配置文件,如需生效必须重新生成索引
/usr/local/webserver/coreseek/bin/indexer –rotate –config
/usr/local/webserver/coreseek/etc/sphinx.conf –all 在不停止sphinx服务情况下
更新增量索引
/usr/local/webserver/coreseek/bin/indexer –rotate –config
/usr/local/webserver/coreseek/etc/sphinx.conf test2stemmed
使用时使用增量索引来搜索,增量索引需要计划任务执行(数据有变化以后需更新索引才可以)
分享到:
相关推荐
分布式sphinx配置文件 支持分词库 支持中文分词库 亲测试可以用
全文搜索配置## 命令行获取信息查询。 ## 我们进行索引一般只会返回主键id,而不会返回表中的所有字段。 ## 但是在调试的时候,我们一般需要返回表中的字段,那这个时候,就需要使用sql_query_info。 ## 同时这个...
windows 下 sphinx 增量索引配置文件 mssql
- `conf.py`: 配置文件,定义项目设置,如主题、扩展、源文件路径等。 - `index.rst`: 主入口文件,引导Sphinx构建文档结构。 - `_static/`: 存放静态资源,如CSS、JavaScript和图片。 - `_templates/`: 自定义...
- `model_path.txt`:指向语言模型和声学模型的路径配置文件。 - `zh.glm`:中文语言模型文件,定义了词汇和句子的概率分布。 - `hmm`:声学模型目录,包含了训练得到的模型参数文件。 - `audio.wav`:待识别的音频...
`sphinx.conf`是Sphinx的主要配置文件,包含了索引定义、源设置、搜索守护进程(searchd)配置、网络接口设定等。例如,你可以定义一个索引名为`test_index`,指定数据源(如MySQL),设置索引字段、分词器、排序...
为了方便起见,将Sphinx安装在`D:/develop/`目录下可以避免路径问题,使得配置文件中的路径设置更为直观。 5. **Java查询**: Java查询Sphinx可以通过`sphinx4j`库提供的API进行。这包括建立连接、发送查询请求、...
3、创建Sphinx配置文件 13 4、初始化sphinx.conf中配置的全部索引 13 5、创建两个shell脚本,一个用来创建主索引、一个用来创建增量索引。 13 ⑴、主索引更新脚本 13 ①、创建脚本build_main_index.sh: 13 ②、赋予...
2. **创建 Sphinx 配置文件**:编写 Sphinx 配置文件以指定数据来源和索引设置。 3. **生成索引**:根据配置文件生成索引文件。 4. **启动 Sphinx 服务**:启动 Sphinx 服务,以便接收搜索请求。 5. **使用 Sphinx ...
"可直接运行"的标签意味着这个压缩包可能包含了一个预配置好的Sphinx环境,或者包含了运行Sphinx所需的配置文件和依赖,用户可以直接启动并进行测试,无需进行复杂的初始设置。 在文件名称列表中,只有一个名为 ...
首先,将提供的中文声学模型解压并导入到Sphinx4的配置文件中,确保声学模型路径设置正确。接着,你需要使用提供的词典文件更新Sphinx4的词典配置,确保所有目标词汇都被包含。最后,配置语言模型,这可能涉及到训练...
重命名为jar文件,然后参考sphinx4的hello world修改其中的配置文件,使之使用我们提供的jar包即可。 注意,要把jar包放到classpath哦。 经过个人的测试,识别率还是比较高的。 8、总结与问题 总的来讲,训练时只...
Sphinx-4的配置文件(通常是config.xml)需要根据项目需求进行适当修改,包括设置声学模型、语言模型以及麦克风设备等。 【声学模型与语言模型】 声学模型是Sphinx-4的核心组成部分,它将音频信号映射到发音单元...
3. **编写配置文件**:定义索引的结构,如字段、权重等,并指定搜索结果的排序规则。 4. **构建和更新索引**:运行Sphinx命令行工具,对论坛数据进行初次索引,并设置定期自动更新。 5. **集成API**:在Discuz! ...
3. 分布式搜索:Sphinx支持分布式索引,通过配置文件设置多个数据源,`setLimits()`可限制每个数据源的返回结果。 四、异常处理与调试 PHP7 Sphinx扩展支持异常处理,当查询失败时会抛出异常。你可以使用try-catch...
1. Sphinx 的核心配置文件通常位于 /usr/local/sphinx/etc/sphinx.conf。 2. 配置文件中可以定义索引、源数据、搜索查询等信息。 3. 例如,下面是一个Minimal Sphinx 配置文件示例: ```sql source sqllog { type ...
- **Sphinx服务无法启动**:检查配置文件是否有误,确保MySQL服务正常运行,并且Sphinx能够连接到MySQL数据库。 - **搜索结果不准确**:调整Sphinx的匹配模式、权重设置等参数,以提高搜索结果的相关性和准确性。 - ...
6. **配置文件`conf.py`**:每个Sphinx项目都有一个配置文件,用于设置全局选项,如源文件路径、输出目录、语言设置、链接检查等。 7. **构建过程**:使用`sphinx-build`命令行工具,用户可以方便地编译文档,监控...
- 安装完成后,需要配置 Sphinx 的 `sphinx.conf` 配置文件,其中包括定义数据源(如 SQL 数据库)、索引设置、搜索服务端口等关键参数。 3. **数据源配置**: - Sphinx 支持通过 SQL 连接数据库进行索引,需要在...
2. **配置文件**:如`config.mk`和`sphinx.conf`,前者用于编译设置,后者则是Sphinx引擎的主要配置文件,包含索引设置、数据源配置、搜索结果排序规则等。 3. **文档**:可能包括HTML格式的手册页、README文件和...