`

sphinx总结

 
阅读更多

-----

4.1 安装:

mmseg 如果出错

aclocal
libtoolize --force 我运行后有一个错误,没管它。
automake --add-missing
autoconf
autoheader
make clean
./configure --prefix=/usr/local/mmseg3

 

 

sphinx如下

cd csft-4.1

 sh buildconf.sh

...

 

------------------------------------

看文档:http://www.coreseek.cn/docs/coreseek_3.2-sphinx_0.9.9.html#ref-indexer

使用实例

http://bbs.linuxtone.org/thread-7595-1-1.html

 

 

 

php

多个索引,php 端 用$sphinx->query('关键字', '索引1,索引2');

索引1,2 顺序是有意义的,权值和属性值 后面的高于前面的

 

【搜索多个关键词】,

尝试 批量查询 Addquery + RunQueries,  注意  前面的setFilters会被后面使用,所以要清除: ResetFilters,排序等也一样。

 

另一种:

设置匹配模式为 SPH_MATCH_BOOLEAN,然后用 | 分隔,我直接用 | 不加 () 不好使,用了() 和 | 配合才行,

$keyword = "(蝴蝶男)|(混蛋)";

$sphinx->SetMatchMode(SPH_MATCH_BOOLEAN);

 

默认 只出来20个结果,这里自定义一下

$sphinx->setLimits($offset,$length,$length);

 

 

 

----------------

 

一元分词 要配合着 独立的中文分词才有效果

 

 

不用一元分词:

#以下部分为中文分词核心配置
	#stopwords

		= /path/to/stowords.txt的位置
	charset_dictpath

		= /usr/local/mmseg3/etc/
	charset_type

		= zh_cn.utf-8
	#charset_table

                    = .................... #需将原有
的该配置注释掉
	ngram_len

                    = 0
#以上部分为中文分词核心配置

还能配置mmseg产生这个效果,搜“张三丰”,含 太极宗师,武当宗师的也能搜出来

张三丰
-太极宗师,武当祖师,

 

 

-------------------

 

http://www.9enjoy.com/post/436/

 

第1,把增量索引存到共享内存中
第2,主索引和增量索引没有通过sph_counter表来记录主索引到达的ID,而是使用时间戳来判定,很适用于论坛的贴子索引。

第 3,只需要Query($query,"main,delta"),就可以让程序搜索主索引+增量索引了。

 

 

 

 

 

服务器

更新索引的时候 加 --rotate ,不影响spginx搜索的正常使用

平滑重启 参数 SIGTERM

 

 

 

-----------------------------------------------------
索引:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all
更新索引:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate(可以定时每天更新一次)
搜索服务启动:/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf
搜索服务关闭:/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf --stop
搜索测试:/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf -a 王

参考:
安装:http://www.coreseek.cn/products-install/install_on_bsd_linux/
PHP+MySQL使用Sphinx:http://www.coreseek.cn/products-install/step_by_step/
一元分词配置:http://www.coreseek.cn/products-install/ngram_len_cjk/
API:http://www.coreseek.cn/products-install/api-list/

 

参考
http://www.coreseek.cn/products-install/step_by_step/
http://docs.php.net/manual/zh/book.sphinx.php

 

 

 

分享到:
评论

相关推荐

    php7的sphinx扩展,适用linux,mac

    总结,PHP7的Sphinx扩展是实现高效全文搜索的关键组件,尤其在处理大量数据和中文文本时。正确安装和配置Sphinx、CoreSeek以及相应的客户端库,能为开发者带来便捷的搜索体验。在Linux和Mac环境下,需注意系统依赖和...

    sphinx中文语音训练手册

    8、总结与问题 总的来讲,训练时只需要提供语料文件和录音文件,形式上比较简单,但要给一个好的语料文件还需要不断试验。 上面的步骤和脚本都是根据sphinx的文档来的。需要注意的是,版本不同,内容可能也会不同。...

    sphinx支持discuz包

    **总结** 结合Sphinx的全文检索功能和Discuz! 的社区管理平台,可以为用户提供更高效、准确的搜索体验。通过深入理解Sphinx的工作原理和Discuz! 的结构,开发者可以进一步优化搜索功能,提升整个社区的用户体验。这...

    php7.3-sphinx.zip

    总结来说,PHP7.3版本的Sphinx扩展为开发人员提供了便捷的接口,以利用Sphinx的全文搜索功能。然而,开发者需要注意扩展与PHP版本的匹配,避免因版本不兼容导致的问题。正确安装和使用Sphinx扩展,可以在项目中实现...

    sphinx简体中文教程,pdf版本

    总结,Sphinx教程提供了从基础到高级的全面指导,无论你是新手还是有经验的开发者,都能从中受益。通过学习这个教程,你可以掌握Sphinx的基本用法,创建出专业且美观的技术文档,提升项目的专业性和可维护性。

    Sphinx-完整中文手册

    总结来说,Sphinx和Coreseek提供了全面的全文检索解决方案,涵盖了从建立索引到执行搜索查询的各个方面。它们的高效性、灵活性以及丰富的功能使得它们成为企业和开发者在进行文本信息检索时的理想选择。而提供的中文...

    Linux下php+sphinx实例

    总结,结合Linux、PHP和Sphinx,你可以构建一个高效、灵活的全文搜索系统,适合于各种Web应用的需求。这个实例展示了如何从MySQL数据库获取数据,构建Sphinx索引,并在PHP中执行查询。记住,实践是最好的老师,通过...

    php7 sphinx扩展

    总结,PHP7 Sphinx扩展为开发者提供了一个强大而方便的工具,用于与Sphinx搜索引擎进行交互。了解其基本用法和高级特性,能够有效提升Web应用的搜索体验和性能。在实际开发中,应根据项目需求灵活运用各种功能,并...

    php 搜索Sphinx

    六、总结 Sphinx作为一种高性能的全文检索引擎,为大数据量的搜索提供了强有力的解决方案。结合PHP语言的强大功能,开发者可以轻松构建高效、灵活的搜索系统,满足各种复杂场景下的搜索需求。无论是企业级应用还是...

    pocketsphinx库学习用的一个简单的语言模型(lm、dic文件)

    总结来说,Pocketsphinx库的学习和应用涉及到语言模型的构建、发音词典的创建以及有效的语料处理。掌握这些基本元素,将有助于我们深入理解语音识别的内在机制,并能灵活地应用于实际项目中,实现高效准确的语音交互...

    sphinx-3.4.1-efbcc65-windows-amd64.zip

    **五、总结** Sphinx-3.4.1 是一个强大的文档生成工具,尤其适合 Python 项目,通过其丰富的功能和扩展,可以帮助开发者轻松创建专业、美观的文档。对于 Windows 平台的 AMD64 用户,这个版本提供了稳定的支持。...

    sphinx-2.1.8

    总结来说,Sphinx 是一个强大且灵活的文档工具,特别适合于技术文档的编写。其2.1.8版本可能包含了一系列改进和优化,以提高用户体验和文档质量。通过学习和掌握 Sphinx,你可以为你的项目创建专业、易读的文档,...

    使用sphinx生成API文档

    #### 六、总结 通过以上步骤,你可以轻松地为Python项目生成API文档。Sphinx不仅简化了文档编写过程,还提供了丰富的扩展功能,使得文档更加专业和易于维护。无论是对于个人项目还是团队协作,使用Sphinx生成文档都...

    Sphinx 在 windows 下安装使用.docx

    5. **总结**: Sphinx在Windows下的安装和配置虽然相对于Linux可能稍显复杂,但仍然为开发者提供了一种方便的本地开发环境。其强大的全文检索功能和多种语言支持使其成为在多个平台上实现高效搜索功能的理想选择。

    Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip

    总结来说,Android平台上使用PocketSphinx进行离线语音识别,通过定制化的语言模型和acoustic model,以及有效的参数配置,可以在小范围内实现高准确度的识别。这个项目为那些需要离线、快速、私密的语音交互应用...

    sphinx-for-chinese windows

    总结起来,Sphinx for Chinese 是一款专为中文环境设计的全文搜索引擎,它结合了 Sphinx 的强大功能和对中文的特殊处理,为开发人员提供了一种高效、灵活且易于集成的解决方案,以实现高质量的中文搜索体验。...

    sphinx4-1.0beta6-bin.zip

    **总结:** Sphinx4是一个强大的Java语音识别框架,它的1.0 beta 6版本的二进制包简化了开发者集成语音识别功能的过程。通过理解和利用Sphinx4的各个组件,可以构建出适应不同应用场景的语音识别系统。对于希望快速...

    sphinx-for-chinese下载安装包.rar

    总结,Sphinx-for-Chinese是一个专门针对中文环境优化的全文搜索引擎,适用于PHP开发。通过下载、安装、配置、索引创建和PHP集成,我们可以将Sphinx-for-Chinese应用于各种需要搜索功能的项目中,提升用户体验。

    联想SphinX人像识别软件

    总结来说,联想SphinX人像识别软件代表了联想在人工智能领域的技术实力,它利用尖端的人像识别技术,为用户提供高效、安全的识别解决方案,无论是在个人设备安全还是公共安全管理上,都有广阔的应用前景。...

    sphinx-for-chinese(sfc)

    总结来说,Sphinx-for-Chinese 是一个为了解决中文全文搜索挑战而设计的解决方案,它通过集成中文分词和拼音支持,增强了Sphinx在中文环境下的表现。结合MySQL和其他数据源,SFC为开发者提供了强大的全文检索能力,...

Global site tag (gtag.js) - Google Analytics