`
文章列表
Regain修改笔记     一、修改增加中文分词模块为 Paoding-analysis   非常简单,只需要修改一个源码文件。   源代码文件(以下都用下划线表示):src\net\sf\regainRegainToolKit.java import net.paoding.analysis.analyzer.PaodingAnalyzer;import org.apache.lucene.analysis.cn.ChineseAnalyzer;         public static Analyzer createAnalyzer(String analyzerType,    Str ...
  【monner的一点小感想】 个人最近研究Lucene时候,发现其搜索语句的词法语法搞到挺复杂的。 其实搜索引擎作为普通大众的工具,更多的应该在其搜索的准确性和速度方面做功夫, 大多数人都是输入个关键字就完成了搜索,很 ...
Lucene的查询语法 英文原版:http://lucene.apache.org/java/2_0_0/queryparsersyntax.html 原文来自:http://liyu2000.nease.net/article/Lucene/queryparsersyntax.htm 绪论 Lucene提供了方便您创建自建查询的API,也通过QueryParser提供了强大的查询语言。 本文讲述Lucene的查询语句解析器支持的语法,Lucene的查询语句解析器是使用JavaCC工具生成的词法解析器,它将查询字串解析为Lucene Query对象。 项(Term) 一条搜索语句被 ...
一、Regain简要介绍(摘录网上) regain是一款与Web搜索引擎类似的桌面搜索引擎系统,其不同之处在于regain不是对Internet内容的搜索,而是针对自己的文档或文件的搜索,使用regain可以轻松地在几秒内完成大量数据(许多个G)的搜索。Regain采用了Lucene的搜索语法,因此支持多种查询方式,支持多索引的搜索及基于文件类型的高级搜索,并且能实现URL重写及文件到HTTP的桥接,并且对中文也提供了较好的支持。  Regain提供了两种版本:桌面搜索及服务器搜索。桌面搜索提供了对普通桌面计算机的文档与局域网环境下的网页的快速搜索。服务器版本主要安装在Web服务器上,为网 ...
深更半夜,千辛万苦终于找到了基本满足自己需要的本地全文搜索引擎 -----她就是regain!!! 真的挺不错的,支持中文!支持多重格式!全文搜索!自动提取结果摘要! 抑制不住自己的兴奋心情!!!借用这里记下自己的心情!!! 等花几天好好研究下,慢慢写点心得。
最近研究了几个比较流行的开源搜索引擎和相关包,其中zilverline属于比较小巧精致, 功能强大,比较完美支持中文,支持多种文件类型,包括PDF/WORD/XLS/PPT/TXT/RTF等等, 而且功能模块很方便扩展,虽然项目稍停滞,但是作为个人使用或者研究,的确值得一试! 1.下载zilverline,项目好像已经停滞了,目前最后的版本是zilverline-src-1.5.0.zip   解压源码到特定目录。 2.试着用ant编译了下,发现提示有误,zilverline默认是采用maven编译,不过一样可以 修改为ant编译。 只需要修改如下两个文件: (1)build.propert ...
Global site tag (gtag.js) - Google Analytics