http://www.sphinxsearch.com/
Sphinx是一个俄国人开发的搜索引擎,它的主要特点是:
一、性能非常出色 150万条记录一两分钟就索引完毕,2-4GB以内的文本检索速度不到0.1秒钟。ferret也望尘莫及,更不要说lucene了。
二、和数据库集成性很好 Sphinx通过配置文件可以自行读取数据库信息做索引,不依赖任何外部的应用程序,并且可以作为一个daemon进程启动,支持分布式检索,并发响应性能很好。因此很多过去使用ferret的人因为并发检索的问题都改用Sphinx了。
三、可以做MySQL的全文检索 MySQL的数据库引擎是可插拔的结构,Sphinx开发了一个SphinxSE数据库引擎,可以在编译MySQL的时候直接编译到MySQL里面去,这样的话,可以在数据库级别支持高性能的全文检索,那么你可以以如下SQL方式去全文检索了:
select * from xxxx where query='test;sort=attr_asc:group_id' AND ....;
很棒吧。
四、RoR支持也很棒 有一个acts_as_sphinx插件,类似acts_as_ferret,集成到RoR里面很简单。
Sphinx支持UTF-8编码的分词,但是他自己的文档上面说仅仅支持英文和俄文的分词,可能对中文分词还存在问题。
|
相关推荐
本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。 本文档编写日期 2013-04-23 1、为什么要训练? sphinx4目前的版本中仅提供了英文等语音识别库。...
【语音识别技术与Sphinx-4简介】 语音识别技术是一种将人类语音转化为机器可理解文本的技术,广泛应用于智能助手、电话交互系统、自动驾驶等领域。Sphinx-4是卡内基梅隆大学(CMU)开发的一个开源语音识别引擎,...
3. 编译并安装扩展:运行`phpize`来配置编译环境,然后执行`./configure --with-sphinx=/path/to/sphinx`,最后使用`make && make install`完成编译和安装。 4. 更新PHP配置:将新安装的Sphinx扩展添加到php.ini文件...
CMU Sphinx是一款开源的语音识别引擎,主要用于将连续的语音信号转换为文本。这款工具广泛应用于各种领域,如智能家居、语音助手、电话自动服务系统等。CMU Sphinx由卡内基梅隆大学(Carnegie Mellon University)...
《探索pocketsphinx-android-demo:语音识别在Android平台的应用》 在移动设备上,语音识别技术已经成为人机交互的重要组成部分,极大地提升了用户体验。本资源包——"pocketsphinx-android-demo",是专为Android...
**Pocketsphinx语音库详解** Pocketsphinx是CMU Sphinx项目的一部分,由卡内基梅隆大学(Carnegie Mellon University)开发,是一款强大的、开源的语音识别引擎,主要用于离线语音识别。它专为资源有限的设备设计,...
标题中的“pocketsphinx在windows下的中文语音识别Demo”表明了本文将关注如何在Windows操作系统中使用开源项目Pocketsphinx进行中文语音识别的演示。Pocketsphinx是一个轻量级的语音识别引擎,尤其适用于嵌入式系统...
这个压缩包包含了针对中文语言的特定模型和资源,使得Sphinx能够处理和理解中文语音输入。"zh-CN" 表明这是为中国汉语设计的版本,适应普通话的语音特征。 描述中的链接指向了一个官方的下载源,提供了一个名为 ...
Sphinx4是一款强大的开源Java语音识别引擎,专为实时、高精度的语音处理而设计。在中文环境下,Sphinx4的使用需要特定的声学模型、词典和语言模型,以便能够准确地理解和识别中文语音输入。下面我们将深入探讨这些...
sphinx系统是一个拥有悠久历史的语音识别系统,李开复自称第一个sphinx是他写的。 传说 中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和 sphinx2请大家...
Sphinx是一款强大的全文搜索引擎软件,尤其在文档管理和网站构建中广泛应用。它以其高效、可扩展性和灵活性著称,被许多大型项目采纳为他们的基础搜索工具。Sphinx 2.2.10是该软件的一个稳定版本,适用于Linux操作...
CoreSeek/Sphinx是一款强大的开源全文搜索引擎,最初基于俄罗斯数据库公司Altap的数据库搜索引擎技术。它为互联网和企业级应用提供快速、有效的搜索解决方案。Sphinx特别适合处理大量数据和提供实时搜索服务。Sphinx...
Sphinx4是一个强大的开源语音识别框架,主要由Java语言编写,提供了一整套完整的工具和库,用于构建高质量的语音识别系统。这个压缩包“sphinx4-5prealpha-src.zip”包含了Sphinx4的最新预发行版本(5prealpha)的源...
《深入理解Pocketsphinx:基于lm与dic文件的语音识别》 Pocketsphinx是一个轻量级的开源语音识别引擎,广泛应用于嵌入式系统和移动设备。它属于CMU Sphinx项目的一部分,由卡内基梅隆大学开发。Pocketsphinx的设计...
本文将详细介绍pocketsphinx以及其在中文语音识别中的应用。pocketsphinx是一款开源的、轻量级的语音识别引擎,它主要用于离线语音识别任务,特别适合于资源有限的设备上运行。该软件包是CMU Sphinx项目的一部分,由...
在Python环境中,我们可以使用`pocketsphinx`,这是`cmusphinx`的一个轻量级版本,专门用于嵌入式设备和服务器。通过`pocketsphinx-python`这个Python绑定库,开发者可以轻松地将`cmusphinx-zh-cn-5.2`模型集成到...
数据库搜索引擎Sphinx是一款高效、可定制且功能丰富的全文搜索引擎,主要设计用于Web应用,以便快速地从大量数据中检索相关信息。Sphinx的核心特性包括实时索引、近实时搜索以及高度可扩展性,使得它在处理大数据量...
**Sphinx 概述** Sphinx 是一个高性能、全文搜索引擎库,主要被设计用于Web应用,提供快速且精准的搜索功能。它是一个开源项目,由俄罗斯的 Andrew Aksyonov 创建,起初是为了解决其在线教育平台的搜索需求。Sphinx...
**安卓离线语音识别技术详解:PocketSphinx Demo** 在当今的移动应用开发中,语音识别功能已经成为一种不可或缺的交互方式。特别是在智能助手、车载导航、智能家居等领域,用户可以通过语音命令来控制设备或获取...