`
dawuafang
  • 浏览: 1192167 次
文章分类
社区版块
存档分类
最新评论

Sphinx2.1.9使用HTML文件作为索引源技术要点备忘

 
阅读更多

踏得网站内教程和手册的查找功能,建立在Sphinx上,其最新发布版本为2.2.11。

Sphinx既能支持数据库索引,也支持对文本文件(xml、html、txt等)和json结构文件进行直接索引。

对文本文件建立索引的主要步骤如下:

1. 使用脚本程序把所有文件的路径录入到数据库中的一张表中(至少包含2个字段,id和全路径文件名)

2. 在sphinx.conf中添加相应的索引源(source)和索引定义(index)

sql_query = SELECT id,title,file_name,url,type from your_table_name
sql_file_field = file_name

3. 用sphinx api查询设置title有较高的权重

4. 分页处理时,按sphinx api返回的id排序,参见:

http://dev.mysql.com/doc/refman/5.5/en/string-functions.html#function_field

语法示例:ORDER BY field(id, 2, 1, 4);

5. 构建文件内容摘要列表,其中$docs为所有匹配文件的内容列表,$index为索引名,$opts里面可以定义样式和限制字数等:

$sphinx->BuildExcerpts($docs, $index, $keyword, $opts);


分享到:
评论

相关推荐

    sql全文索引 sphinx

    SQL全文索引是一种在数据库中实现全文搜索的技术,它允许用户使用自然语言查询数据库,而不仅仅是精确匹配。Sphinx是一个高性能、开源的全文搜索引擎,它为SQL数据库提供了强大的全文索引功能。Sphinx与SQL结合使用...

    windows 下 mssql sphinx 增量索引配置文件

    windows 下 sphinx 增量索引配置文件 mssql

    sphinx使用rt实时索引源码

    - **rt_index.h/cpp**:这是Sphinx RT索引的主要实现文件,包含了RT索引的数据结构定义和操作函数。 - **dict_rt.h/cpp**:定义了RT索引的字典操作,如查找、插入和更新文档。 - **mva.h/cpp**:多值属性(MVA)...

    php+mysql+sphinx实现近实时索引

    2. Sphinx的配置文件(如`searchd.conf`和`sphinx.conf`)是否正确设置了数据库连接参数和索引配置。 3. PHP代码中与Sphinx交互的部分是否有语法错误或逻辑问题。 4. 检查服务器资源,确保内存和CPU足够处理索引更新...

    sphinx实时索引介绍ppt

    介绍sphinx实时索引的特点和工作机制

    sphinx 安装及使用

    - 执行`indexer.exe test1`命令建立索引,这里的`test1`对应于`sphinx.conf`文件中配置的索引名。 **7. 测试搜索功能** - 使用`search.exe test`命令进行搜索测试,注意最后一行的`error`提示可忽略。 - 对于...

    java 整合 sphinx

    配置Sphinx通常涉及编辑`sphinx.conf`文件,设置数据源、索引、搜索服务等参数。在Java应用中,可能还需要配置连接参数,如主机名、端口、索引名称等。为了方便起见,将Sphinx安装在`D:/develop/`目录下可以避免...

    pocketsphinx库学习用的一个简单的语言模型(lm、dic文件)

    使用这些文件,初学者可以在不在线生成模型的情况下,快速搭建Pocketsphinx环境并进行语音识别实验。通过修改和完善这些文件,我们可以调整识别系统的性能,例如增加词汇量、优化语言模型等,以适应不同的应用场景。...

    sphinx-0.9.8.tar.gz

    - `conf`目录:包含Sphinx的配置文件,如`sphinx.conf`,用于设置索引的详细配置,如数据源、索引结构、排序规则等。 - `src`目录:包含了Sphinx的源代码,用户可以在此基础上进行二次开发或自定义扩展。 - `bin`...

    Windows下安装使用Sphinx

    2. **创建 Sphinx 配置文件**:编写 Sphinx 配置文件以指定数据来源和索引设置。 3. **生成索引**:根据配置文件生成索引文件。 4. **启动 Sphinx 服务**:启动 Sphinx 服务,以便接收搜索请求。 5. **使用 Sphinx ...

    PHP搜索引擎Sphinx使用教程.zip

    3. **MySQL与Sphinx的整合**:Sphinx可以与MySQL协同工作,通过MySQL作为数据源,Sphinx负责构建和维护索引,提供快速的搜索。文件名“PHP+Sphinx+Mysql做搜索引擎_lj详细.doc”和“PHP+MySQL+SPHINX安装配置与测试 ...

    pocketsphinx的声学模型文件-zh_broadcastnews

    CMU Sphinx的旧版声学模型文件。 内部包含: 声学模型:zh_broadcastnews_16k_ptm256_8000 语言模型:zh_broadcastnews_64000_utf8.DMP 拼音字典:zh_broadcastnews_utf8.dic

    sphinx 的安装及使用 windws centos coreseek

    1. 配置文件通常为`sphinx.conf`,需要设置数据源(例如MySQL)、索引设置(如文档字段、分词器)、搜索服务参数等。 2. 文件`csft_sinykk.conf`可能是作者自定义的Coreseek配置文件,可能包含了特定的中文处理设置...

    sphinx在linux的安装和使用方法

    例如,如果想要使用MySQL作为数据源,则需要指定MySQL的库文件路径。 ```bash ./configure --with-mysql=/usr/local/mysql make sudo make install ``` ##### 2.4 配置Sphinx 安装完成后,需要对Sphinx进行相应的...

    sphinx+mysql 安装手册

    在Sphinx中,MySQL主要作为数据源,提供原始数据供Sphinx建立索引。 ### 三、Sphinx的安装 1. **操作系统准备**:确保系统已安装必要的依赖,如GCC编译器、Boost库等。 2. **下载Sphinx**:从Sphinx官网获取最新...

    sphinx的demo

    - 安装完成后,需要配置 Sphinx 的 `sphinx.conf` 配置文件,其中包括定义数据源(如 SQL 数据库)、索引设置、搜索服务端口等关键参数。 3. **数据源配置**: - Sphinx 支持通过 SQL 连接数据库进行索引,需要在...

    Sphinx搜索引擎架构与使用文档(和MySQL结合)V1.1.

    2、创建Sphinx主索引文件、增量索引文件存放目录 12 3、创建Sphinx配置文件 13 4、初始化sphinx.conf中配置的全部索引 13 5、创建两个shell脚本,一个用来创建主索引、一个用来创建增量索引。 13 ⑴、主索引更新脚本...

    Sphinx使用1

    我们可以使用 MySQL 数据库作为我们的数据源,使用 SQL 语句来查询我们的数据。例如,我们可以使用以下语句来定义我们的数据源: ```sql source goods { type = mysql sql_host = localhost sql_user = root sql...

    CoreSeek/Sphinx中文手册

    建立索引是Sphinx搜索服务的核心部分,涉及到定义数据源、属性、多值属性(MVA)、索引设置、数据源限制和字符集处理。Sphinx支持多种数据源,如SQL、xmlpipe、Python等,每种数据源都有其特定的索引方式和配置选项...

Global site tag (gtag.js) - Google Analytics