`
wtb
  • 浏览: 106256 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

ferret+acts_as_ferret+RMMSeg全文索引+中文分词的使用

阅读更多

首先,在ubuntu下要安装

atp-get install build-essential  zlib1g-dev

ruby需要安装dev包

1、安装ferret

sudo gem install ferret

2、安装acts_as_ferret

可用gem

sudo gem install acts_as_ferret

或用plugins

svn://projects.jkraemer.net/acts_as_ferret/trunk/plugin/acts_as_ferret

个人建议用gem稳点

到此安装结束

在model中添加

acts_as_ferret :fields=>[:title,:body] 后面表示索引的字段

程序中查询用  模型名.find_by_contents("查询内容")

手工更新索引

Model.disable_ferret



#create or modify records



Model.enable_ferret



Model.bulk_index(id_array)

安装RMMSeg

RMMSeg是基于台湾人开发的MMSeg的一个ruby版的中文分词包

sudo gem install rmmseg 

在enviroment.rb中插入

require_gem 'rmmseg'
require 'rmmseg/ferret'

 

然后,模型中使用ferret的时候采用RMMSeg的分词

 acts_as_ferret({:fields =>



       {:title=>{},



     :body =>{:store=>:yes,:term_vector=>:with_positions_offsets



       }}},



       {:analyzer=>RMMSeg::Ferret::Analyzer.new



     })

 

 

分享到:
评论
2 楼 zhangzldipan 2008-07-25  
1 楼 leondu 2008-05-21  
rmmseg作者是浙大的pluskid

相关推荐

    E022-渗透测试常用工具-使用ferret进行Cookie劫持.pdf

    在这个过程中,使用了ferret工具来执行Cookie劫持,这是一种常见的攻击手段,用于获取用户的登录凭据,特别是那些存储在Cookie中的会话ID。以下是整个过程的详细解释: 1. **环境准备**: 在这个场景中,我们有两...

    工具Ferret(含代码)

    工具Ferret是一款在黑帽子大会上亮相的安全工具,主要用于研究目的,其功能是截获邮箱登录过程中的Cookie信息。在网络安全领域,理解这样的工具是非常重要的,因为它揭示了网络攻击者可能使用的手段,同时也为安全...

    ferret 6.84 for win7 64

    FERRET 绘图软件 6.84 for win64 安装方式,解压到任意目录,直接执行bin\bash.exe或bin\mintty.exe原方式操作,直接执行bin\ferret_v6.84.exe 直接进入FERRET

    Go-Ferret一种声明式Web爬虫系统

    在Web爬虫领域,Go-Ferret提供了一种高效且易于使用的解决方案,尤其适合于UI测试、机器学习以及数据分析等场景。 1. **声明式编程**:Go-Ferret的核心特性是其声明式的API设计。这意味着用户可以明确地指定想要...

    ferret简明手册

    ### FERRET简明手册知识点概述 #### 一、FERRET简介与基本操作 - **Commandline模式**:启动FERRET时,默认进入命令行模式,提示符为“yes?”,用户可以通过此模式输入命令。 - **FERRET-GUI**:通过`ferret-gui`...

    Ruby搜索引擎Ferret.zip

    Ferret 是 Java 全文搜索引擎 Lucene 的 Ruby 移植版本。 标签:Ferret

    Ferret 是用于实时嵌入式控制系统的免费软件 lisp 实现_Makefile_代码_相关文件_下载

    Ferret 是一个免费软件 lisp 实现,旨在用于实时嵌入式控制系统。Ferret lisp 编译成自包含的C++11。生成的代码可在支持C++11兼容编译器的任何操作系统和/或微控制器之间移植。它已经过验证,可以在从内存低至2KB 的...

    Ferret ruby下的搜索引擎技术

    ruby下的搜索引擎。With the introduction of Ferret, Ruby users now have one of the fastest and most flexible search libraries available. And it's surprisingly easy to use.

    Ferret工具源代码

    几年前的黑帽子大会后传出的一个工具Ferret。作者声称可以利用他截获邮箱登录过程中的cookie信息。进而可以随意侵入他人的信箱。曾在黑帽子大会上当场演示如何破解gmail,hotmail等信箱。终于等到作者把代码和工具都...

    JavaEye3.0开发手记

    - **插件**:`ferret`, `acts_as_ferret`, `multilingual_ferret_tools` - **用途**:实现全文检索功能。 - **特点**:可根据具体需求调整和优化。 **3. Attachment_fu** - **用途**:处理附件存储,利用 ...

    Image Ferret-开源

    "Image Ferret"是一款开源的图像搜索工具,它专为帮助用户在互联网上高效地查找、探索和发现各种图像、照片以及艺术作品而设计。这款软件的独特之处在于它能够自动学习用户的偏好,根据用户对图像的喜好进行智能推荐...

    Ferret-crx插件

    使用Ferret-crx插件,用户不仅可以提升工作效率,还能享受到更为统一、简洁的浏览体验。这款插件可能还具备一定的智能学习能力,能够根据用户的搜索习惯进行优化,提供更加个性化的搜索建议。 在安装方面,Ferret....

    Arduino-ferret.zip

    Arduino-ferret.zip,ferret是一个用于实时嵌入式控制系统的自由软件lisp实现。,Arduino是一家开源软硬件公司和制造商社区。Arduino始于21世纪初,深受电子制造商的欢迎,Arduino通过开源系统提供了很多灵活性。

    一个MIME检测库.zip

    《深入理解MIME检测库:以Ferret为例》 在信息技术领域,MIME(Multipurpose Internet Mail Extensions)是一种标准,用于定义非ASCII字符的数据类型,尤其在电子邮件、Web和其他Internet协议中广泛应用。MIME扩展...

    easy_search:提供了一个很好且简单的 DSL 来搜索 ActiveRecord 模型

    还有很多其他(很棒的)全文插件(例如,acts_as_ferret、sphinx/ultrasphinx 等)。 这只是对您的ActiveRecord模型的简单、快速的搜索。 因此,如果您正在寻找一种搜索解决方案来搜索您的 1000 万条记录数据库,请...

    Ferret.Net-开源

    【标题】"Ferret.Net-开源" 【描述】中的知识点: 1. **Ferret.Net**:这是一个专为IT专业人士设计的开源类库,它主要用于处理网络套接字通信,提供跨平台的支持。 2. **基于接口**:这意味着Ferret.Net的设计遵循...

    Ferret CMS-开源

    考虑到网站管理者的使用体验,Ferret CMS 设计了直观且用户友好的界面。通过简洁的布局和清晰的导航,使得非技术背景的用户也能轻松上手。编辑内容、发布更新、管理用户和监控工作流状态都变得非常直观,从而降低了...

    ferret-opencv

    雪貂opencv 用于OpenCV雪貂绑定(require '[ferret-opencv.core :as cv])(def cam (cv/video-capture 0))(let [f (cv/query-capture cam)] (cv/imwrite "image_latest.png" f))样品CMake cmake_minimum_required...

    Python库 | txtferret-0.1.0-py3-none-any.whl

    "ferret"这个词在英语中指的是雪貂,一种善于挖掘和寻找的小动物。在这里,它可能是象征着库能够深入文本数据中,挖掘出有价值的信息。版本号"0.1.0"表明这是该库的初步版本,可能存在更多的更新和发展空间。 ...

    vscode-uri:VS Code及其扩展中使用的URI实现

    该模块包含VS Code及其扩展使用的URI实现。 它支持将字符串解析为scheme , authority , path , query和fragment URI组件,如下面所定义: : foo://example.com:8042/over/there?name=ferret#nose \_/ \______...

Global site tag (gtag.js) - Google Analytics