`
dazuiba
  • 浏览: 131414 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

ferret索引,使用中文分析器时,存在内存泄漏

阅读更多
一共100万条待索引记录,前10万条没有任何问题。但一过这个数量,内存以每秒5m的速度攀升,之后就没有减下来过。
但,切换到ferret默认的StanderdAnalyzer,内存占用从开始,到结束,都很平稳。

软件环境:
       解析器:MultilingualFerretTools( http://svn.lingr.com/plugins/multilingual_ferret_tools/)
       ferret:0.11.5

不知道robbin有没有遇到这个问题。
分享到:
评论
3 楼 dazuiba 2007-12-13  
重复提交,
2 楼 dazuiba 2007-12-13  
robbin 写道
这个分析器的确有严重的性能问题,曾经差点把我们服务器挂掉。分析器还是自己写吧,另外ActsAsFerret的机制也很不好,不要去用。自己基于ferret去写索引和查询的程序。

我为aaf写了个增量索引的补丁,每次只做10万条,反复做10次。
这样基本解决了索引的memery leak 问题,至于以后的索引更新,到以后用到再说吧,至少目前不会有这个问题。

分析器也懒得再重新写了,有空了再说。

对于acts_as_ferret,我只用了它的索引制作功能,其他的update,insert都不会用它的。
因为,这个插件有一个很大的性能问题:
      aaf_configuration[:ferret].update(
        :key               => (aaf_configuration[:single_index] ? [:id, :class_name] : :id),
        ...................
      )
  这里,aaf默认的:key设置为对象的id,但这个:key在ferret里面是建议不使用的。据我测试,如果使用:key,会使索引速度慢100倍!
1 楼 robbin 2007-12-12  
这个分析器的确有严重的性能问题,曾经差点把我们服务器挂掉。分析器还是自己写吧,另外ActsAsFerret的机制也很不好,不要去用。自己基于ferret去写索引和查询的程序。

相关推荐

    E022-渗透测试常用工具-使用ferret进行Cookie劫持.pdf

    在这个过程中,使用了ferret工具来执行Cookie劫持,这是一种常见的攻击手段,用于获取用户的登录凭据,特别是那些存储在Cookie中的会话ID。以下是整个过程的详细解释: 1. **环境准备**: 在这个场景中,我们有两...

    Go-Ferret一种声明式Web爬虫系统

    在Web爬虫领域,Go-Ferret提供了一种高效且易于使用的解决方案,尤其适合于UI测试、机器学习以及数据分析等场景。 1. **声明式编程**:Go-Ferret的核心特性是其声明式的API设计。这意味着用户可以明确地指定想要...

    ferret简明手册

    - **Commandline模式**:启动FERRET时,默认进入命令行模式,提示符为“yes?”,用户可以通过此模式输入命令。 - **FERRET-GUI**:通过`ferret-gui`命令打开图形前端界面,便于用户通过图形界面进行操作。 #### 二...

    工具Ferret(含代码)

    在下载和使用Ferret时,必须遵守法律和道德规定,只应用于合法的安全测试和研究,避免对他人造成不必要的损害。压缩包内的readme.txt文件很可能是提供关于工具的使用指南和注意事项,包括如何安装、运行以及如何解读...

    Ruby搜索引擎Ferret.zip

    Ferret 是 Java 全文搜索引擎 Lucene 的 Ruby 移植版本。 标签:Ferret

    ferret 6.84 for win7 64

    FERRET 绘图软件 6.84 for win64 安装方式,解压到任意目录,直接执行bin\bash.exe或bin\mintty.exe原方式操作,直接执行bin\ferret_v6.84.exe 直接进入FERRET

    Ferret工具源代码

    几年前的黑帽子大会后传出的一个工具Ferret。作者声称可以利用他截获邮箱登录过程中的cookie信息。进而可以随意侵入他人的信箱。曾在黑帽子大会上当场演示如何破解gmail,hotmail等信箱。终于等到作者把代码和工具都...

    Ferret ruby下的搜索引擎技术

    ruby下的搜索引擎。With the introduction of Ferret, Ruby users now have one of the fastest and most flexible search libraries available. And it's surprisingly easy to use.

    Ferret 是用于实时嵌入式控制系统的免费软件 lisp 实现_Makefile_代码_相关文件_下载

    Ferret 是一个免费软件 lisp 实现,旨在用于实时嵌入式控制系统。Ferret lisp 编译成自包含的C++11。生成的代码可在支持C++11兼容编译器的任何操作系统和/或微控制器之间移植。它已经过验证,可以在从内存低至2KB 的...

    Image Ferret-开源

    "Image Ferret"是一款开源的图像搜索工具,它专为帮助用户在互联网上高效地查找、探索和发现各种图像、照片以及艺术作品而设计。这款软件的独特之处在于它能够自动学习用户的偏好,根据用户对图像的喜好进行智能推荐...

    Ferret-crx插件

    总体来说,Ferret-crx插件是一款非常适合经常使用多个搜索引擎进行信息检索的用户的工具。它简化了搜索流程,提供了一个方便快捷的统一搜索界面,并且通过个性化的用户体验优化,使得信息检索更加高效。虽然它主要...

    Arduino-ferret.zip

    Arduino-ferret.zip,ferret是一个用于实时嵌入式控制系统的自由软件lisp实现。,Arduino是一家开源软硬件公司和制造商社区。Arduino始于21世纪初,深受电子制造商的欢迎,Arduino通过开源系统提供了很多灵活性。

    Python库 | txtferret-0.1.0-py3-none-any.whl

    安装txtferret库相当简单,只需要使用Python的包管理器pip。在命令行中输入以下命令即可: ```bash pip install txtferret-0.1.0-py3-none-any.whl ``` 完成安装后,开发者就可以在Python代码中通过import语句来...

    pnw-ferret:政治与战争的数据收集和分析工具

    在实际应用中,"pnw-ferret"可能被政策分析师、记者、学者或者研究人员广泛使用,他们需要对全球政治和军事动态进行快速响应和深入理解。这种工具的价值在于它能将海量的信息转化为有针对性的知识,从而提升决策质量...

    Ferret.Net-开源

    【标题】"Ferret.Net-开源" 【描述】中的知识点: 1. **Ferret.Net**:这是一个专为IT专业人士设计的开源类库,它主要用于处理网络套接字通信,提供跨平台的支持。 2. **基于接口**:这意味着Ferret.Net的设计遵循...

    Ferret CMS-开源

    考虑到网站管理者的使用体验,Ferret CMS 设计了直观且用户友好的界面。通过简洁的布局和清晰的导航,使得非技术背景的用户也能轻松上手。编辑内容、发布更新、管理用户和监控工作流状态都变得非常直观,从而降低了...

    一个MIME检测库.zip

    因此,在使用Ferret时,应做好异常处理,避免因文件无法识别而导致程序崩溃。 - **安全考虑**:在处理用户上传的文件时,MIME检测是防止恶意文件上传的第一道防线。确保正确识别并限制危险类型的文件,如执行脚本或...

    渗透测试常用工具应用(PDF课件)

    使用Weevely工具上传一句话木马.pdf ...使用ferret进行Cookie劫持.pdf 使用SSHMitm中间人拦截SSH.pdf 使用Armitage的MSF进行自动化集成渗透测试.pdf 使用………… ……………… 使用vega对web进行漏洞扫描.pdf

    Ferret4J-开源

    Ferret4J旨在成为Java应用程序的轻量级MVC框架。 它基于以模型为中心的体系结构,并努力减少干扰。 您可以在我的博客中找到更多信息,网址为http://blackship.eu/category/my-projects/jferret/

Global site tag (gtag.js) - Google Analytics