最新文章列表

基于Java的全文索引/检索引擎——Lucene 转

http://www.chedong.com/tech/lucene.html
hunteagle 评论(0) 有1009人浏览 2007-03-02 12:28

毕业设计3---Nutch的使用

        今天研究了Nutch, 差不多已经好几个小时了, 到现在还没有搞定,也这么晚了, 先记录下来,明天继续吧。        一开始很多时间都浪费在了cygwin的安装上了,bs这个软件的开发者了, 一个不伦不类的软件安装程序,安装的时候还要从网上下载东东。。。。。不过最后终于装成功了, 先下载到本地后,再安装的(建议 下载站点中选 TW的比较块)。    下面是我安装CYGWIN和NU ...
fullfocus 评论(1) 有3546人浏览 2007-03-02 00:53

lucene搜索和权限怎么结合呢?

现有一已有的CMS系统,希望在原来的关键词搜索基础上加上全文检索。 该CMS系统原有的权限设计是这样的:有一个cms_info表,我们假设其中最有用的是id,keywords,content 3个字段,字段见名知意,另外还有一个cms_acl表,其中最有用的字段是refid,visit 2个字段,refid是cms_info的id字段外键,visit是访问类型,具体解释一下visit:该CMS系统中 ...
apollo7733 评论(4) 有3526人浏览 2007-03-01 02:25

prefuse翻译文档

Prefuse is an extensible software framework for helping software developers create interactive information visualization applications using the Java programming language. It can be used to build standa ...
yuping322 评论(3) 有4448人浏览 2007-02-27 15:35

[zz]深入lucene索引机制

developerWorks 中国  >  Java technology | Open source  > 深入 Lucene 索引机制 ...
imjl 评论(1) 有3673人浏览 2007-02-21 11:43

[zz]lucene index 包分析

Index包分析 转载自http://www.gamvan.com/club/clubPage.jsp?ccStyle=0&tID=10633&ccID=37 Lucene索引中有几个最基础的概念,索引(index),文档(document),域(field),和项(或者译为语词term) 其中Index为Document的序列   Document为Field的序列  Fie ...
imjl 评论(1) 有3495人浏览 2007-02-21 11:40

ant学习日记(一)

ant以前都使用,也简单学习过,不过只是需要了就用,用也只用一部份。不过现在很多正规的外包项目都要求用ant进行打包的,要求比较严格,所以在春 ...
sys53 评论(0) 有1608人浏览 2007-02-16 23:54

Lucene相关度排序的调整

如欲转载,请注明作者:caocao,来源http://caocao.iteye.com/。 Lucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于关键词的内部评分和做索引时的boost。默认Score高的排前面,如果Score一样,再按索引顺序,先索引的排前面。那么有人问了,如果我要先索引的排后面怎么办呢?隐士研究了源码后发现这是相当简单的事情。以 ...
caocao 评论(2) 有5397人浏览 2007-02-12 11:58

[转载]搜索关键字高亮显示

一般情况下,需要对搜索结果进行高亮显示,主要用到正则匹配,  好像Lucene搜索引擎保护了高亮显示的处理类,但是在服务器端的,就在返回的结果里面就处理了, js 代码 /*----------------------------------------*\     * 使用 js 标记高亮关键词 by markcxz(markcxz@aol.com)    * 参数说 ...
xyh 评论(1) 有2879人浏览 2007-02-12 11:48

使用SSH+Freemarker做新闻发布系统

           最近,使用近半个月的时间,其实也就是熬过3个夜完成了一个符合SEO的初级网站。           主要使用技术:struts+spring+hibernate,使 ...
heweiya 评论(15) 有9081人浏览 2007-02-07 17:18

Java 常用API文档

JDK 1.6.0_beta API: http://www.dlog.cn/javadoc/jdk1_6_0_beta2/index.html J2EE 5.0 Update 1 : http://java.sun.com/javaee/5/docs/api/ Struts 1.3.5 API: http://www.dlog.cn/javadoc/struts-1.3.5/docs/apid ...
guanfish 评论(0) 有1444人浏览 2007-02-01 12:00

一个令人期待的RCP

Apogee项目(ECM Rich ClientPlatform)是一个基于Eclipse RCP 技术之上的内容管理器架构, 该项目目前在Eclipse社区广泛的收集建议, 从它的Scope可以看出, 其功能是相当强大的, 使用了较多的热门技术. Apogee主要分为两大块: 核心平台(Core Platform) 和应用平台(Applicaiton Platform), 前者提供了底层的文档管理 ...
doku 评论(0) 有1100人浏览 2007-01-25 16:20

Dom4j的使用(全而好的文章)

Dom4j 使用简介 作者:冰云 icecloud(AT)sina.com 时间:2003.12.15   版权声明: 本文由冰云完成,首发于CSDN, ...
xhy0422 评论(42) 有136954人浏览 2007-01-24 17:43

dom4jAPI[1]--用dom4j建立,修改XML文档,并解决格式化输出和中文问题

import java.io.File;<o:p></o:p> import java.io.FileWriter;<o:p></o:p> import java.util.Iterator;<o:p></o:p> import java.util.List;<o:p></o:p>
xhy0422 评论(1) 有4736人浏览 2007-01-24 16:41

Ant学习(2)

Ant示例参考 六.部分实例参考(网上找的): xml 代码   1. 例一:   <project default="usage" basedir=".">                    <target name="init">       &l ...
chenzhuo1016 评论(0) 有1030人浏览 2007-01-23 15:35

Lucene中文分词“庖丁解牛”

 Lucene中文分词 “庖丁解牛”  附件 为本人设计编写的组件,中文分词“庖丁解牛”,具有相当好的使用价值。。。 高效率:我的赛扬PC 1 秒解析 >>> 20000汉字的词语  (实际测试结果数据,可达1秒10万+汉字。) 高可维护性:使用“庖丁”隐喻,形象明晰 高灵活性,可扩展:OOD 对比:《终于突破中文分词的效率问题》http://www.lucene.org.cn ...
Qieqie 评论(72) 有49158人浏览 2007-01-23 12:19

搜索篇:Struts、Lucene的Web实例

代码是网上下载的,有兴趣的可以看一下 这里用到的Lucene是1.43版本的,Struts是用1.2版本的 里面有在Web上进行建立索引,删除,搜索等操作,可以看一下
lighter 评论(9) 有7964人浏览 2007-01-15 23:10

征服AJAX.LUCENE构建搜索引擎

征服AJAX.LUCENE构建搜索引擎本书分Ajax和Lucene两部分,共16章,内容涵盖了JavaScript的基础、层迭样式表CSS、DOM与JavaScript、AjaX工作流程、Ajax实例、Ajax的安全问题与性能测试、Lucene基础、用Lucene来建立索引、Lucene搜索、Lucene的分析器、高级搜索技巧、Lucene性能测试、Lucene的中文问题以及Lucene的工具箱Sa ...
itsenser 评论(0) 有1009人浏览 2006-12-06 02:50

Compass读文档笔记

Compass读文档笔记 Compass是基于Lucene 的更高层的抽象,假如你正打算做关于搜索方面的模块的话,那我建议你使用Compass,他提供了可配置方案,而且比Lucene更加容易使用。如果你的系统中使用Spring, Hibernate,JDO, IBatis。。。 Compass是最好的选择,他能够非常方便的集成到现有系统中去。 1. Compass的 ...
dengyin2000 评论(1) 有3165人浏览 2006-07-06 16:00

Compass读文档笔记

Compass读文档笔记 Compass是基于Lucene 的更高层的抽象,假如你正打算做关于搜索方面的模块的话,那我建议你使用Compass,他提供了可配置方案,而且比Lucene更加容易使用。如果你的系统中使用Spring, Hibernate,JDO, IBatis。。。 Compass是最好的选择,他能够非常方便的集成到现有系统中去。 ...
ruruhuang 评论(0) 有1203人浏览 2006-07-06 16:00

最近博客热门TAG

Apache(33931) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics