最新文章列表

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 Field:Document中的一个字段,相当于数据库中的Column ,Fie ...
yinhj 评论(0) 有1028人浏览 2007-11-10 21:51

lucene索引参数优化

1。maxBufferedDocs       缓存在内存中的document数目,超过他以后会写入到磁盘 2.   maxFieldLength     一个Field中最大Term数目,超过部分忽略,不会index到field中,所以自然也就搜索不到 3.maxMergeDocs     一般不用设置,,默认值: Integer.MAX_VALUE 4.mergeFactor         a ...
ttitfly 评论(0) 有1913人浏览 2007-06-28 15:52

lucene支持内存索引

lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。 http://www.onjava.com/lpt/a/3273,而尽可能减少IndexSearcher的创建和对搜索结果的前台的 ...
ttitfly 评论(0) 有3088人浏览 2007-06-28 11:24

关于lucene2.0的创建、检索和删除功能的完整实现

转载: http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx<o:p></o:p> <o:p></o:p> 关于lucene2.0的创建、检索和删除功能的完整实现<o:p></o:p> <o:p> </o:p> 最近要 ...
ttitfly 评论(0) 有1484人浏览 2007-06-28 11:07

Lucene Hack之通过缩小搜索结果集来提升性能

作者:caocao(网络隐士),http://www.caocao.name,http://www.caocao.mobi 转载请注明来源:http://www.iteye.com/topic/78884 一、缘起 Lucene在索引文件上G之后的搜索性能下降很严重,随便跑个搜索就要上0.x秒。如果是单线程搜索那么性能尚可,总可以在0.x秒返回结果,如果是Web式的多线程访问,由于Lucen ...
weiwu83 评论(0) 有1796人浏览 2007-06-27 17:13

Lucene的使用与优化

1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告 ...
marine_chen 评论(0) 有1264人浏览 2007-06-27 09:59

Lucene通过缩小搜索结果集来提升性能

一、缘起 Lucene在索引文件上G之后的搜索性能下降很严重,随便跑个搜索就要上0.x秒。如果是单线程搜索那么性能尚可,总可以在0.x秒返回结果,如果是Web式的多线程访问,由于Lucene的内部机制导致数据被大量载入内存,用完后立即丢弃,随之引起JVM频繁GC,性能极其低下,1-10秒的长连接比比皆是。这也是世人为之诟病的Lucene应用瓶颈问题,那么是否有解决方法呢? 二、思路 我们来观 ...
marine_chen 评论(0) 有1075人浏览 2007-06-25 03:43

内容仓库模型JCR(转载

原文地址:http://www.onjava.com/pub/a/onjava/2006/10/04/what-is-java-content-repository.html?page=4           JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也对内容仓库做出了自己的定义,它认为内容仓库是一个高级的信息管理系统,该系统是是传统的数据仓库的扩展,它提供了 ...
sumongh 评论(3) 有4733人浏览 2007-06-23 00:57

使用开源组件搭建搜索引擎

在开发中小型搜索引擎的过程中,我使用由Java开发的开源软件:jspider,htmlparser,lucence,IKAnalyzer,下面我一一道来。 lucence很著名啦,不必多说,我写的这个引擎就是在它自带的demo基础上重构的。 jspider顾名思义,是一个用Java开发的爬虫。 htmlparser是解析html页面的,因为lucene自带的html解析器不够健壮,所以用了这个。 ...
yuhai.china 评论(11) 有5164人浏览 2007-06-22 13:00

lucene分词分析器Analyzer

SimpleAnalyzer StandardAnalyzer WhitespaceAnalyzer StopAnalyzer 测试代码: import java.io.Reader; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene ...
wq163 评论(2) 有5040人浏览 2007-06-20 19:27

推荐一本入门书<Lucene in Action>

建议看原版。 我觉得这本书能让你对lucene有一个大概的了解,要深入,靠这本书不可能的。 两名作者目前现在都是lucene的Project Management Committee. 有什么看法也可以回帖,大家一起讨论。如果有必要,我可以将问题转给otis本人。
imjl 评论(2) 有4580人浏览 2007-06-18 20:04

搜索爱好者有家了

非常感谢javaeye能提供这么个平台,让我们这些lucene的爱好者有了能聚在一起互相学习的机会。 圈子的地址: http://lucene-group.group.iteye.com/
imjl 评论(0) 有3860人浏览 2007-06-17 22:08

lucene 中的删除deleteDocuments

从昨天开始,自己又着手搞更新.好象lucene中没有很好的方法去更新.只好用deleteDocuments把它删除了.再添加进去. 不过自己按书写的代码如下: public static boolean deletSomeField(String id) throws IOException {   IndexReader reader = null;     try {       reader ...
ssxiao 评论(3) 有3383人浏览 2007-06-16 15:05

请教:compass+spring+hibernate2能否对多表建立索引?

目前系统采用struts+spring1.2+hibernate2作为架构,采用compass1.1+lucene作为搜索引擎。对5个表可以进行索引,并且查询没有问题,但对5个以上表进行索引时发现一个问题,系统没有报任何异常,compass始终没有建立索引,并且没有释放session,导致系统无法使用。后台代码如下: 信息: Starting Coyote HTTP/1.1 on port 8080 ...
jjlloo 评论(5) 有3259人浏览 2007-06-13 16:20

每天一剂Rails良药之acts_as_ferret

Ferret是Ruby的文本搜索引擎,它基于Apache Lucene 安装Ferret非常简单: gem install ferret Ferret是一堆C代码的Ruby代码封装,Ferret是针对Ruby的而不是RoR的 而Acts As Ferret则是针对RoR的 我们有两种方式安装Acts As Ferret: 1,以gem方式安装 gem install acts_as ...
hideto 评论(6) 有5962人浏览 2007-06-12 18:02

在一个.net sln中包含多个project,project引用同一个dll导致的错误

在一个.net sln中包含多个project,其中四个project应用了同一个.net assamply:Lucene.Net。这四个project其中一个编译异常: ForumsDataSource.cs(5): The type or namespace name 'Lucene' could not be found (are you missing a using directive o ...
shanyou 评论(0) 有868人浏览 2007-06-12 05:44

Lucene基本使用介绍(转载)

Lucene基本使用介绍 类别:lucene学习 查看评论
jenkinv 评论(0) 有1113人浏览 2007-06-05 18:23

免费的晚餐--Google技术学习

 作者:江南白衣,原文出处: http://blog.csdn.net/calvinxiu/archive/2007/01/31/1498597.aspx,转载请保留出处。   如果说Google的搜索引擎是免费的早餐,Gmail们是 ...
江南白衣 评论(0) 有2880人浏览 2007-01-31 09:40

Compass--在Lucene之上作了什么增强?(Pragmatic系列)

 已加入Opensymphony的Compass 是对Lucene搜索引擎在企业应用(数据库应用)中的增强。 Lucene本身的API已经非常简单,看看IBM DW上的Beef up Web search apps with Lucen ...
江南白衣 评论(0) 有1514人浏览 2006-08-15 11:41

Nutch 0.8笔记--Google式的搜索引擎实现

    作者:江南白衣    Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。    Nutch 0.8 完全使用Hadoop重写了骨干代码,另外很多地方作了合理化修正,非常值得升级。1.Nutch 0.8 的安装与运行nutch 0.7. ...
江南白衣 评论(0) 有1843人浏览 2006-08-09 09:40

最近博客热门TAG

Apache(33929) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics