最新文章列表

JavaEye3.0开发手记之三 - 狮身人面

Sphinx的含义是“狮身人面像”,是古埃及的金字塔建筑,传说Sphinx是有翼的狮身女怪,她常叫过路行人猜谜, 猜不出者即遭杀害。 但是我这里说的Sphinx是一个高性能的搜索引擎: http://www.sphinxsearch.com/ Sphinx是一个俄国人开发的搜索引擎,它的主要特点是: 一、性能非常出色 150万条记录一两分钟就索引完毕,2-4GB以内的文本检索速度不到0.1秒 ...
robbin 评论(30) 有23263人浏览 2007-09-10 19:02

我的WebLucene安装经验

我的WebLucene安装经验     由于项目的需要,最近看了一些有关lucence的内容,后来才发现我们所需要的在车东先生在开源项目weblucene中已经完全实现了,这几天尝试了安装,其间发现了一些问题,这里与大家分享一下     首先大家应该看看车东先生的weblucene中的build.txt和  http://blog.donews.com/dev2dev/archive/2006 ...
dodomail 评论(1) 有1625人浏览 2007-09-10 17:58

WebLucene之安装习行录

            WebLucene之安装习行录     清人颜元曾说过:“学而必习,习又必行,固也”。若干年来,本人一直对这句话奉若神明,深感只有致用才能巩固学的效果,发现学的不足,享受学的乐趣。   搜索引擎在近几年的发展虽没有大的突破,却逐步走向成熟,走向商业。同时,随着开源的搜索引擎逐渐增多,门槛也逐步降低,使得普通程序员也能有机会接触到这一高深的领域。由于对搜索引擎的兴趣所致,笔者也 ...
dodomail 评论(0) 有1528人浏览 2007-09-10 17:54

基于Lucene/XML的站内全文检索解决方案:WebLucene

基于Lucene/XML的站内全文检索解决方案:WebLucene 作者:车东 发表于:2003-05-06 18:05 最后更新于:2007-07-16 11:07 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明。 http://www.chedong.com/tech/weblucene.html ------------------------------ ...
dodomail 评论(1) 有1613人浏览 2007-09-10 17:50

Lucene倒排索引原理

Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:    0)设有两篇文章1和2  文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too.  文章2的内容为:He once lived in Shanghai.    1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的 ...
Callan 评论(5) 有7271人浏览 2007-09-04 20:17

开源全文搜索引擎框架JBOX-beta版发布

天刚完成的,做了好久了。一个纯java的全文搜索引擎框架。 做这个的目标是,更简单,更容易,以至任何一个懂java的人都可以很容易地搭建一个个人用的搜索引擎,例如个人站点的站内搜索。 主页:http://j-box.sourceforge.net/index_cn.html API文档、QUICK START都有。 Jbox目前是beta版本,如果各位朋友发现bug了,麻烦发邮件到j-box- ...
hzxdark 评论(15) 有4788人浏览 2007-09-01 19:28

《Struts In Action》中文版书籍

《Struts In Action》是In Action系列中的一本 In Action 系列图书有: 01- Ajax In Action (2006) 02- JavaServer Faces In Action (2005) 03- Spring In Action (2005) 04- SWTJFace In Action (2005) 05- Hibernate In Action ( ...
oxidy 评论(0) 有6076人浏览 2007-08-30 08:36

Lucene的查询语法

1,一个短句可以用双音号括起来,这样只有文中含有该句的时间才会被搜索出来.比如:    "hip hop"将会只出现包含hip hop(不区分大小写)的短句2,一个字段名后面跟冒号,再加上要搜索的词语或短句,就可以直接搜索该字段.比如:要搜索在 1981年10月20日出生的会员可以这样:    age:19811020 如果是短句,则是:   age:"1981 10 ...
wangyi878750 评论(0) 有4602人浏览 2007-08-29 04:17

Paoding 2.0.2记录

Paoding 2.0.2记录 paoding 现在在svn上的代码能够支持 自动动态装载词典,并检测词典是否发生了更新、删除。 也支持关闭自动监测(paoding.stopAutoDetecting),而提供一个方法paoding.forceDetecting手动执行一次检测。 现在这个版本为2.0.2,但是现在不打算打成jar包和zip包。 待之后2.0.3支持简繁体、提供GBK->U ...
Qieqie 评论(4) 有5045人浏览 2007-08-28 17:20

lucene问题

索引已经建立,但就是检索不到数据。hits.length()一直为0 public Hits search(String queryString) { Hits hits = null; try { File file = new File(indexPath); Directory directory = FSDirectory.getDirectory(file); ...
zoven 评论(4) 有925人浏览 2007-08-22 10:27

Lucene2.0与lucene1.4的比较

  前阵子说看了Ajax+Lucene之后就写读后的体会的,但是事情多,一直拖到了现在。 简单就写一点2.0与1.4之间最常用的地方的改变 1.4中doc.add(Field.text(...))之类的写法,是往document中加feild的时候,直接调用Filed的static方法 由以下几种 Field.Text(...) Field.Keyword(...) Field.Unindexed( ...
yonguo 评论(3) 有2047人浏览 2007-08-21 10:48

lucene全文搜索引擎

Lucene(发音为 ['lusen] )是一个非常优秀的开源的全文搜索引擎,我们可以在它的上面开发出各种全文搜索的应用来。Lucene在国外有很高的知名度,现在已经是Apache的顶级项目,在国内,Lucene的应用也越来越多。<o:p></o:p> 一.用Lucene建立索引    用lucene建立索引, Lucene是一个高性能的java全文检索工具包,它使用的是倒排 ...
hnhxwyx 评论(2) 有1937人浏览 2007-08-21 10:14

Compass

这是我第一篇成文的英文技术翻译,里面一些常用的技术名词没有翻译,英文单词意思更明了 Compass提供了一些简单和熟悉的API。说熟悉是因为他为了降 ...
dragonzhu 评论(1) 有2652人浏览 2007-08-15 18:04

中文分词 庖丁解牛 版本号 2.0.1

庖丁解牛 中文分词 版本号 2.0.1 --------------------------------------------------- 相对2.0.0版本变更如下: 重构(!): svn上的代码和字典从原来的GBK编码转化为UTF-8编码(使用Eclipse下载代码的同学需要改变工程的encoding) ->从统计上,更多人使用UTF-8而非GBK,故改之;望谅。 重构(!): ...
Qieqie 评论(12) 有5487人浏览 2007-08-14 17:42

构建基于词典的Lucene分析器

构建基于词典的Lucene分析器 solo L 发布日期:2006年09月03日,更新日期:2006年10月03日 Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包。但是对于绝大多数中文用户来说其提供的两个中文分析器(ChineseAnalyzer和CJKAnalyzer)的能力又太弱了,因此我们有必要开发适合自己的中文分析器。这篇文章中给出了一个基 ...
zhangljerry 评论(0) 有1860人浏览 2007-08-13 17:52

自己写的lucene的高亮类

网上有很多高亮的类,但我觉得太负责了(也许他们觉得这样性能更高),我写了一个很简单采用je分词+正则解决高亮问题,实际使用下来还是不错的: java 代码 import java.util.Iterator;    import java.util.List;       /**    * @author edwardpro    *    ...
edwardpro 评论(1) 有2200人浏览 2007-08-10 16:03

中文分词 庖丁解牛 2.0.0版本发布

庖丁解牛 最新版本2.0.0 主要变更: 1)调整了package命名 改为net.paoding.analysis开头;调整了一些类的命名,主要是XAnalyzer改为 PaodingAnalyzer之类的。 2)并调整了部分代码的相对位置:代码集中在三个包中: net.paoding.analysis.dictionary 字典抽象--这是核心代码之一 net.paoding. ...
Qieqie 评论(32) 有16311人浏览 2007-08-08 14:31

totjforum-大型商业门户论坛系统(java)

专业门户论坛解决方案********************************************************************************************totjforum介绍**************************************************************************************** ...
yuping322 评论(0) 有1277人浏览 2007-07-16 09:17

prefuse 翻译文档

 Prefuse is an extensible software framework for helping software developers create interactive information visualization applications using the Java programming language. It can be used to build stand ...
yuping322 评论(0) 有1482人浏览 2007-02-27 15:21

lucene学习

刚刚开始学习java,发现有一句话说得很好啊,java是一种由生产力的语言,呵呵,最近看了车东的lucene的文章,很受启发,不过在删除的时候碰到了问题 ...
zjnbshifox 评论(0) 有1101人浏览 2005-04-19 01:17

最近博客热门TAG

Apache(33929) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics