论坛首页 Java企业应用论坛

从Lucene 2.0升级到2.1.0之路

浏览 14268 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2007-04-12  
作者:caocao(网络隐士),转载请注明来源:http://caocao.iteye.com/blog/70305
 
随着Lucene 2.1.0在2007年情人节的问世,隐士遂将本来基于的2.0的应用升级到了2.1.0,升级日志如下:(2.1.0新功能请参见http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_1_0/CHANGES.txt
 
1. LUCENE-478:新版在StandardAnalyzer将CJK分割为CJ, K,对于中文分词基本没用,隐士自创的中文分词基本没有修改直接使用,没有问题。
 
2. LUCENE-438:Token的final终于被砍了,大快人心。当初为了实现中文分词,隐士本想继承Token,加入一些中文相关的metadata,无奈Token被阉,隐士只好另起炉灶重写了好多代码,这次算是迟来的正义吧,将代码重构一下是正道,无奈项目催得紧,以后再重构了,暂时不会负面影响。
 
3. 好些deprecated的玩意都被砍了,好在隐士实现的所有应用都没有调用过deprecated的东西,所以没有修改过一行代码。
 
4. 经过试验验证:2.1.0可以兼容读取2.0的索引文件,2.1.0可以增量索引2.0的索引文件,optimize后索引文件是2.1.0的格式。这个相当方便,可以平稳过渡至新版本,相当于无痛分娩。
 
5. LUCENE-771:lock文件现在移到了索引目录,很简洁,一目了然。
 
6. LUCENE-565:重量级的功能,IndexWriter.updateDocument闪亮登场,隐士赶紧把delete/add替换成updateDocument。至于到底能提高多少性能,有待观察。
 
7. LUCENE-701:Lockless commits挺诱人的,看了一下IndexReader,deleteDocuments还在,没深入研究和IndexWriter的deleteDocuments有什么区别。
 
8. LUCENE-544:这个也是好东西哦,MultiFieldQueryParser可以允许为Field指定boost了。
 
9. LUCENE-723: 可以接受*:*哦,比较危险,一定要过滤这样的玩意,不然整个数据库就裸奔了。
 
总结下来,隐士除了用lucene-core-2.1.0.jar代替lucene-core-2.0.0.jar和把delete/add替换为updateDocument外什么都没做就顺利切换到2.1.0了。
   发表时间:2007-04-12  

compass还不支持 lucene2.1.0
0 请登录后投票
   发表时间:2007-04-16  
hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。
0 请登录后投票
   发表时间:2007-04-16  
江南白衣 写道
hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。


请问hibernate对lucene的集成进展如何?在哪里可以查到?我同样很关注。
0 请登录后投票
   发表时间:2007-04-16  
yuanetking 写道
江南白衣 写道
hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。


请问hibernate对lucene的集成进展如何?在哪里可以查到?我同样很关注。

http://search.hibernate.org/
0 请登录后投票
   发表时间:2007-04-16  
IndexWriter.updateDocument

可以更新而不是 delete/add了??

这个可要好好研究一下,太重要了!!
0 请登录后投票
   发表时间:2007-04-16  
我现在就在学习这方面的知识。
期待有这方面的高人出现
0 请登录后投票
   发表时间:2007-04-27  
从2.0到2.1.0的 变化还有segments文件名变成了segments.gen
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics