本月博客排行
-
第1名
kaizi1992 -
第2名
arpenker -
第3名
wy_19921005 - hanbaohong
- jh108020
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
青否云后端云 - vipbooks
- wy_19921005
- benladeng5225
- fantaxy025025
- e_e
- kaizi1992
- tanling8334
- arpenker
- sam123456gz
- javashop
- zysnba
- xiangjie88
- lemonhandsome
- wallimn
- ganxueyun
- Xeden
- xyuma
- zhanjia
- wangchen.ily
- jh108020
- johnsmith9th
- zxq_2017
- jbosscn
- forestqqqq
- daizj
- ajinn
- xpenxpen
- ranbuijj
- 喧嚣求静
- kingwell.leng
- silverend
- lchb139128
- kristy_yy
- jveqi
- lich0079
- lzyfn123
- java-007
- sunj
- yeluowuhen
- lerf
- xiaoxinye
- flashsing123
- zhangjijun
- lxguy
- bosschen
- lyndon.lin
- sunnylocus
最新文章列表
Lucene应用的一点体会
Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确)
1.多线程索引,共享同一个IndexWriter对象
这种方式效率很慢,主要原因是因为:
java 代码
public void addDocument(Document doc, Analyzer analyzer) throws IOException {
SegmentInfo ne ...
强大的lucene中文分词器
package com.wellhope.lucene;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org ...
lunece建立索引遇到的问题
最近对lucene的检索进行了肤浅的学习 先是把论坛里大部分的lucene的帖子看了下 大致了解了下lucene 决定学习 在自己测试的时候 发现在对大表的创建索引时耗费的时间实在太长 想通过多线程来解决 对一个表的总记录数来决定创建几个线程来创建索引, 结果是报错:
D:\lucene\index\_a.fnm (系统找不到指定的文件。)
Lock obtain timed ou ...
Compass的搜索结果(Hit)
Compass的搜索语法基本上和Lucene一样.但是有两点要注意:Compass读取搜索配置文件, 默认的是对所有元数据都搜索, 这点比Lucene方便. 例如,在Lucene中,你需要指定要搜索的Field, 如果你需要搜索标题域和内容域的话, 唯一的方法就是创建一个全文域将标题域和内容域整合在一起. 而在Compass中, 在配置文件中有all这个选项, 默认情况下就是对所有元数据搜索;另外一 ...
Re: 关于Lucene 做全文搜索的问题
[quote="mao_lu"][quote="江南白衣"]你不是用compass么,但你用的好像是lucene的原生API阿。用compass的话就不用处理这些细节[/quote]那这样的情况怎么解决?[/quote] writer = new IndexWriter(directory, analyzer, false); 给这个false改成true就可 ...
直接从页面如何来构造一个Map的问题,疑惑中.....
环境:
WebWork 2.2.* +Spring 2.*+Hibernate 3.*
因为系统中遗留的问题,有这样的表
id,fieldid,fieldvalue 这种纵表,扩展性是很好,但是有个问题Hibernate处理这种不太好处理,当然也能处理.
在映射的时候,我是这样做的fieldid为该Map的Key,而整个一条记录为Map的Value.当时想设计成Set或者Array 但是因为在代码中 ...
使用领域模型(domain object)来进行索引、搜索
对于讲domain object 映射到关系型数据库中,hibernate等持久性框架做了很多的工作,使得业务逻辑只需要和hibernate等持久层进行交互,而不需要直接和具体的数据库进行交互。
这给程序员带来了很大的方便,在业务逻辑处理上,只要针对domain object就可以。
使用Lucene进行索引、搜索开发的的时候,最经常碰到的概念就是Document 和Field,在程序中一个不得不 ...
Nutch项目配置1---内部网搜索(原)
http://lucene.apache.org/nutch/tutorial8.html
有如下的介绍:
Requirements
Java 1.4.x, either from Sun
or IBM
on Linux is preferred. Set NUTCH_JAVA_HOME
to the root of your JVM installation ...
转载:给Lucene加入性能更好的中文分词
给Lucene加入性能更好的中文分词
转自:http://blog.donews.com/windshow/archive/2005/09/23/564655.aspx
Lucene本身的StandardAnalyzer提供了中文分词接口,不过其采用的为1-gram.
这种分词方法虽然不会损失任何索引信息,但是造成的索引垃圾太多,用户得到的查询结果中垃圾也是很多.
经过认真研究了Lucene的 ...
J2EE的一些个人见解
前几天看了 jwsh的帖子,有感:1、O/R Mapping工具:首选hibernate,国内使用这个的比较多,同时ejb3.0也是基于hibernate实现的。Hibernate技术本质上也是遵守的ODMG标准的,它的出色源于不断的升级、不断的维护、修改。以及完善的文档、人气很旺的论坛,还有很重要的一点就是它的易学易用性。其他的按情况使用,如:jdo,ibatis等。2、事务处理:使用spring ...