`
alfred_long
  • 浏览: 567309 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Sphinx配置文件设置

阅读更多

其实是添加中文分词后进行中文搜索coreseek中的sphinx.conf文件配置

source src2
{

type = mysql

sql_host = 127.0.0.1    // 数据库地址
 sql_user = admin                    //用户名
 sql_pass = admin        //密码
 sql_db = mydb
 sql_port = 3306 # optional, default is 3306

sql_sock = /tmp/mysql.sock    //数据库在linux服务器需开启

sql_query_pre = SET NAMES utf8         //字符编码
 sql_query_pre = SET SESSION query_cache_type=OFF

sql_query = \
 SELECT id, gid, addtime AS date_added, realname \
 FROM order_admin

sql_attr_uint = gid

sql_attr_timestamp = date_added

sql_ranged_throttle = 0

sql_query_info = SELECT * FROM order_admin WHERE id=$id

}

source src2throttled : src2    //为增量索引设置
{
 sql_ranged_throttle = 100
 sql_query = \
 SELECT id, gid, addtime AS date_added, realname \
 FROM order_admin

}

index test2
{

source = src2
 path = /usr/local/webserver/coreseek/var/data/test2

docinfo = extern

mlock = 0

morphology = none

min_word_len = 1
 charset_type = zh_cn.utf-8
 charset_dictpath =/usr/local/mmseg/etc/

# 'utf-8' default value is
 # charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

html_strip = 0
}

//indexer 和searchd 可以默认 如果有需要监听的数据库ip可以在searchd设置

 

index test2stemmed : test2  //增量索引设置
{
 source = src2throttled
 path = /usr/local/webserver/coreseek/var/data/test2stemmed
 morphology = stem_en
}
 每次修改完配置文件,如需生效必须重新生成索引

/usr/local/webserver/coreseek/bin/indexer –rotate –config /usr/local/webserver/coreseek/etc/sphinx.conf –all 在不停止sphinx服务情况下

更新增量索引

/usr/local/webserver/coreseek/bin/indexer –rotate –config /usr/local/webserver/coreseek/etc/sphinx.conf test2stemmed

使用时使用增量索引来搜索,增量索引需要计划任务执行(数据有变化以后需更新索引才可以)

分享到:
评论

相关推荐

    分布式sphinx配置文件 支持分词库

    分布式sphinx配置文件 支持分词库 支持中文分词库 亲测试可以用

    sphinx配置文件

    全文搜索配置## 命令行获取信息查询。 ## 我们进行索引一般只会返回主键id,而不会返回表中的所有字段。 ## 但是在调试的时候,我们一般需要返回表中的字段,那这个时候,就需要使用sql_query_info。 ## 同时这个...

    windows 下 mssql sphinx 增量索引配置文件

    windows 下 sphinx 增量索引配置文件 mssql

    sphinx配置说明

    - `conf.py`: 配置文件,定义项目设置,如主题、扩展、源文件路径等。 - `index.rst`: 主入口文件,引导Sphinx构建文档结构。 - `_static/`: 存放静态资源,如CSS、JavaScript和图片。 - `_templates/`: 自定义...

    sql全文索引 sphinx

    `sphinx.conf`是Sphinx的主要配置文件,包含了索引定义、源设置、搜索守护进程(searchd)配置、网络接口设定等。例如,你可以定义一个索引名为`test_index`,指定数据源(如MySQL),设置索引字段、分词器、排序...

    java 整合 sphinx

    为了方便起见,将Sphinx安装在`D:/develop/`目录下可以避免路径问题,使得配置文件中的路径设置更为直观。 5. **Java查询**: Java查询Sphinx可以通过`sphinx4j`库提供的API进行。这包括建立连接、发送查询请求、...

    Sphinx搜索引擎架构与使用文档(和MySQL结合)V1.1.

    3、创建Sphinx配置文件 13 4、初始化sphinx.conf中配置的全部索引 13 5、创建两个shell脚本,一个用来创建主索引、一个用来创建增量索引。 13 ⑴、主索引更新脚本 13 ①、创建脚本build_main_index.sh: 13 ②、赋予...

    Windows下安装使用Sphinx

    2. **创建 Sphinx 配置文件**:编写 Sphinx 配置文件以指定数据来源和索引设置。 3. **生成索引**:根据配置文件生成索引文件。 4. **启动 Sphinx 服务**:启动 Sphinx 服务,以便接收搜索请求。 5. **使用 Sphinx ...

    sphinx 测试可用 改下数据库

    "可直接运行"的标签意味着这个压缩包可能包含了一个预配置好的Sphinx环境,或者包含了运行Sphinx所需的配置文件和依赖,用户可以直接启动并进行测试,无需进行复杂的初始设置。 在文件名称列表中,只有一个名为 ...

    sphinx4 中文声学模型、词典、语言模型

    首先,将提供的中文声学模型解压并导入到Sphinx4的配置文件中,确保声学模型路径设置正确。接着,你需要使用提供的词典文件更新Sphinx4的词典配置,确保所有目标词汇都被包含。最后,配置语言模型,这可能涉及到训练...

    语音识别 sphinx4 JAVA 教程

    Sphinx-4的配置文件(通常是config.xml)需要根据项目需求进行适当修改,包括设置声学模型、语言模型以及麦克风设备等。 【声学模型与语言模型】 声学模型是Sphinx-4的核心组成部分,它将音频信号映射到发音单元...

    sphinx中文语音训练手册

    重命名为jar文件,然后参考sphinx4的hello world修改其中的配置文件,使之使用我们提供的jar包即可。 注意,要把jar包放到classpath哦。 经过个人的测试,识别率还是比较高的。 8、总结与问题 总的来讲,训练时只...

    sphinx支持discuz包

    3. **编写配置文件**:定义索引的结构,如字段、权重等,并指定搜索结果的排序规则。 4. **构建和更新索引**:运行Sphinx命令行工具,对论坛数据进行初次索引,并设置定期自动更新。 5. **集成API**:在Discuz! ...

    php7 sphinx扩展

    3. 分布式搜索:Sphinx支持分布式索引,通过配置文件设置多个数据源,`setLimits()`可限制每个数据源的返回结果。 四、异常处理与调试 PHP7 Sphinx扩展支持异常处理,当查询失败时会抛出异常。你可以使用try-catch...

    Sphinx入门.docx

    1. Sphinx 的核心配置文件通常位于 /usr/local/sphinx/etc/sphinx.conf。 2. 配置文件中可以定义索引、源数据、搜索查询等信息。 3. 例如,下面是一个Minimal Sphinx 配置文件示例: ```sql source sqllog { type ...

    sphinx在linux的安装和使用方法

    - **Sphinx服务无法启动**:检查配置文件是否有误,确保MySQL服务正常运行,并且Sphinx能够连接到MySQL数据库。 - **搜索结果不准确**:调整Sphinx的匹配模式、权重设置等参数,以提高搜索结果的相关性和准确性。 - ...

    sphinx2.1.1

    6. **配置文件`conf.py`**:每个Sphinx项目都有一个配置文件,用于设置全局选项,如源文件路径、输出目录、语言设置、链接检查等。 7. **构建过程**:使用`sphinx-build`命令行工具,用户可以方便地编译文档,监控...

    sphinx的demo

    - 安装完成后,需要配置 Sphinx 的 `sphinx.conf` 配置文件,其中包括定义数据源(如 SQL 数据库)、索引设置、搜索服务端口等关键参数。 3. **数据源配置**: - Sphinx 支持通过 SQL 连接数据库进行索引,需要在...

    sphinx2.2.10版本tar.gz包

    2. **配置文件**:如`config.mk`和`sphinx.conf`,前者用于编译设置,后者则是Sphinx引擎的主要配置文件,包含索引设置、数据源配置、搜索结果排序规则等。 3. **文档**:可能包括HTML格式的手册页、README文件和...

    CMU Sphinx的语音模型

    在使用CMU Sphinx时,你需要结合合适的字典文件以及其他必要的配置文件(如语言模型、HMM参数等)来构建完整的识别系统。语言模型(LM)描述了单词或词组出现的概率,它可以帮助系统在识别过程中考虑上下文信息,...

Global site tag (gtag.js) - Google Analytics