最新文章列表

使用solr的困惑!

使用solr不长时间,环境是linux as4,到现在solr的文件大小正常大约11G了。 solr放在一台服务器上,利用另一台服务器通过URL进行调用, 但是有一个问题,重建几十万索引好几次都这样,利用solr的接口优化,但是每次索引文件比较大的时候 例如现在11G,他的优化就报错: com.xx.cms.solr.client.SolrServerException: Server ret ...
tovegar 评论(1) 有1878人浏览 2007-10-16 17:23

Lucene入门

  1.Lucene与数据库全文检索比较<o:p></o:p> Lucene 是 Apache Jakarta 的一个子项目,是一个全文检索的搜索引擎库.在接触Lucene之前,我了解不少数据库都实现了全文检索功能。所以我觉得很奇怪:为什么不用数据库提供的供全文检索功能呢?我找了不少资料,车东的一篇文章《Lucene:基于Java的全文检索引擎简介》阐述的比较详细。这里摘录了 ...
mfcai 评论(0) 有1779人浏览 2007-10-13 00:32

分布式系统之分

数据达到一定规模,一台机器不能满足你要求,也许你该考虑分布式。 那么如何分,分的合理。 我觉得可以从这几方面考虑: 1: 业务 2: 效率 3: 余   业务:不同业务会有不一样的划分。举个简单例子,比如我有博客和mp3搜索两部分,这两者对于业务而言,是两个独立部分。那么将博客的索引放在一起,mp3的索引放在一起。 效率:程序设计,操作系统和硬件资源结合。合理使用硬件资源是重点。常见的mysql的i ...
imjl 评论(2) 有4277人浏览 2007-10-10 20:37

LUCENE(java分词工具)

转自:http://www.iteye.com/blog/127968 简述: 在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多 在RoR方面,1、solr, acts_as_solr,2、sphinx,3、ferret
yoyox 评论(0) 有3523人浏览 2007-10-09 17:19

初试Hibernate Search

不久前Hibernate推出了Hibernate Search 3.0 GA,由它的名字大家也可以大概猜到它的作用是对数据库中的数据进行检索的。它是hibernate对著名的全文检索系统Lucene的一个集成方案,作用在于对数据表中某些内容庞大的字段(如声明为text的字段)建立全文索引,这样通过hibernate search就可以对这些字段进行全文检索后获得相应的POJO,从而加快了对内容庞大字 ...
billgmh 评论(21) 有8025人浏览 2007-10-03 16:16

mvnforum安装

安装完jforum后,有一些不尽人意的地方,jforum的安装详情及评价在我的文章里有http://canbeatle.iteye.com/blog/128626, 在www.open-open.com上找开源论坛,听说mvnforum不错,下一个安装试一试。 1:保证机器上有jdk,tomcat和mysql,我使用的版本是jdk1.5+tomcat5.5.7+mysql5.0. 2:到mvnF ...
CanBeatle 评论(2) 有9429人浏览 2007-10-02 09:23

Hibernate Search牛刀小试

        前几天看到Hibernate与Lucene的整合框架Hiberate Search3.0.0.GA版出来了,昨天试这写了一个Demo,感觉用起来的确很方便的,贴出来与大家分享一下。 1、创建POJO java 代码   @Entity   @Table(name = "employee", catalog = "hise" ...
yanghuw 评论(4) 有4642人浏览 2007-09-30 14:00

CompassUitls参照hibernate

/** * */ package com.tnc.lucene.util; import org.apache.log4j.Logger; import org.compass.core.Compass; import org.compass.core.CompassSession; import org.compass.core.CompassTransaction; import org ...
zhangljerry 评论(0) 有1383人浏览 2007-09-30 10:53

使用spring+hibernate集成compass的一个错误!

请参考http://www.springside.org.cn/docs/reference/Compass1.htm上面的文章做的时候,遇到如下的问题: java 代码 java.lang.NoSuchMethodError: org.apache.lucene.document.Field.<init>(Ljava/lang/String;Ljava/lang/Strin ...
heweiya 评论(2) 有3835人浏览 2007-09-29 15:44

JavaEye3.0开发手记之四 - ruby的全文检索

在Java平台上面,lucene是众望所归的全文检索工具,lucene性能不俗,程序稳定,第三方扩展和分词算法众多,但是在RoR方面,就没有那么幸运了,JavaEye网站要做全文检索,怎么来解决全文检索的问题呢? 在ruby平台上面,全文检索有三个途径: 1、solr, acts_as_solr solr是apache开源组织的一个项目,完全基于lucene的最新版本,在lucene的上层提供 ...
robbin 评论(19) 有18422人浏览 2007-09-28 17:07

lucene学习笔记 3

搜索 Lucene搜索的api的类主要有4个 IndexSearcher ,Query(包括子类),QueryParser,Hits IndexSearcher是搜索的入口,他的search方法提供了搜索功能 Query有很多子类, 各种不同的子类代表了不同的查询条件,下文详述 QueryParser是一个非常通用的帮助类,他的作用是把用户输入的文本转换为内置的Query对象(大多数web搜索引擎 ...
lihaiyan 评论(0) 有1664人浏览 2007-09-27 18:05

lucene学习笔记 2

Boosting特性 luncene对Document和Field提供了一个可以设置的Boosting参数, 这个参数的用处是告诉lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优先考虑 lucene默认的boosting参数是1.0,  如果你觉得这个field重要,你可以把boosting设置为1.5, 1.2....等, 对Do ...
lihaiyan 评论(0) 有1692人浏览 2007-09-27 18:04

lucene学习笔记 1

Doug Cutting 于2000年开始的项目 2001年9月后加入apache, Lucene是Doug Cutting的middle name 。 目前Lucene已经是apache的top level的项目, 已经不在jakarta下面, 同时也有了python,perl,c++,.net, Ruby(进行中)多个版本 Lucene 主要的两个任务:indexing and searchin ...
lihaiyan 评论(0) 有1242人浏览 2007-09-27 18:04

使用Lucene进行全文检索---进行搜索

无论是建立索引还是分析内容,都是为了用户的搜索服务.    在Lucene中,如果需要使用搜索,需要使用Searcher类,这是一个抽象类,它有2个子类:IndexSearcher和MultiSearcher.    IndexSearcher是对一个索引进行搜索,如果你需要对多个索引进行搜索,可以使用MultiSearcher.下面的内容只介绍了IndexSearcher.    搜索涉及到几个问 ...
lihaiyan 评论(0) 有1458人浏览 2007-09-27 18:03

使用Lucene进行全文检索---得到有效的内容

  在使用lucene对相关内容进行索引时,会遇到各种格式的内容,例如Html,PDF,Word等等,那么我们如何从这么文档中得到我们需要的内容哪?例如Html的内容,一般我们不需要对Html标签建立索引,因为那不是我们需要搜索的内容.这个时候,我们就需要从Html内容中解析出我们所需要的内容.对于PDF,Word文档,也是类似的要求.     总之,我们只需要从内容中提取出我们需要的文本来建立索 ...
lihaiyan 评论(0) 有1349人浏览 2007-09-27 18:02

lucene-2.0.0的基本应用

首先肯定是建立索引了啊  public void creatIndex() {  File indexDir = new File(getPathIndex());  try { List<Article> listArticle = getArticleDao().search(null, null,null, null, null, null, null, null, new Boo ...
lihaiyan 评论(0) 有1304人浏览 2007-09-27 18:00

Lucene-2.0学习文档

Lucene-2.0学习文档 Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索和操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。 值得一提的是:2006年6月1号Lucene2.0发布, ...
lihaiyan 评论(1) 有1186人浏览 2007-09-27 17:58

lucene搜索引擎技术的分析与整理

4. Lucene文档结构 Lucene中最基础的概念是索引(index),文档(document.,域(field)和项(term)。 索引包含了一个文档的序列。 · 文档是一些域的序 ...
lihaiyan 评论(0) 有2601人浏览 2007-09-27 17:56

实战 Lucene

文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 目前 ...
lihaiyan 评论(0) 有962人浏览 2007-09-27 17:56

全文搜索Lucene

    最近有学员问怎么做站点的全文搜索。       说道搜索,大部分学员想到的就是数据库的模糊查询。模糊查询有两个问题:效率低,不能查找HTML页面上的静态内容。       于是需要工具进行对于网站的全文搜索。基本原理是用工具扫描整个网站的页面,将内容进行索引并保存,然后可以通过用户的关键字搜索。如果你用过google桌面搜索或者msn桌面搜索,应该对这个过程比较了解。       可见一个 ...
Underwind 评论(0) 有513人浏览 2007-09-27 09:59

最近博客热门TAG

Apache(33929) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics