浏览 14264 次
锁定老帖子 主题:从Lucene 2.0升级到2.1.0之路
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2007-04-12
作者:caocao(网络隐士),转载请注明来源:http://caocao.iteye.com/blog/70305
随着Lucene 2.1.0在2007年情人节的问世,隐士遂将本来基于的2.0的应用升级到了2.1.0,升级日志如下:(2.1.0新功能请参见http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_1_0/CHANGES.txt)
1. LUCENE-478:新版在StandardAnalyzer将CJK分割为CJ, K,对于中文分词基本没用,隐士自创的中文分词基本没有修改直接使用,没有问题。
2. LUCENE-438:Token的final终于被砍了,大快人心。当初为了实现中文分词,隐士本想继承Token,加入一些中文相关的metadata,无奈Token被阉,隐士只好另起炉灶重写了好多代码,这次算是迟来的正义吧,将代码重构一下是正道,无奈项目催得紧,以后再重构了,暂时不会负面影响。
3. 好些deprecated的玩意都被砍了,好在隐士实现的所有应用都没有调用过deprecated的东西,所以没有修改过一行代码。
4. 经过试验验证:2.1.0可以兼容读取2.0的索引文件,2.1.0可以增量索引2.0的索引文件,optimize后索引文件是2.1.0的格式。这个相当方便,可以平稳过渡至新版本,相当于无痛分娩。
5. LUCENE-771:lock文件现在移到了索引目录,很简洁,一目了然。
6. LUCENE-565:重量级的功能,IndexWriter.updateDocument闪亮登场,隐士赶紧把delete/add替换成updateDocument。至于到底能提高多少性能,有待观察。
7. LUCENE-701:Lockless commits挺诱人的,看了一下IndexReader,deleteDocuments还在,没深入研究和IndexWriter的deleteDocuments有什么区别。
8. LUCENE-544:这个也是好东西哦,MultiFieldQueryParser可以允许为Field指定boost了。
9. LUCENE-723: 可以接受*:*哦,比较危险,一定要过滤这样的玩意,不然整个数据库就裸奔了。
总结下来,隐士除了用lucene-core-2.1.0.jar代替lucene-core-2.0.0.jar和把delete/add替换为updateDocument外什么都没做就顺利切换到2.1.0了。
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2007-04-12
compass还不支持 lucene2.1.0 |
|
返回顶楼 | |
发表时间:2007-04-16
hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。
|
|
返回顶楼 | |
发表时间:2007-04-16
江南白衣 写道 hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。
请问hibernate对lucene的集成进展如何?在哪里可以查到?我同样很关注。 |
|
返回顶楼 | |
发表时间:2007-04-16
yuanetking 写道 江南白衣 写道 hibernate是用Lucene2.1的。相比compass,现在更关注hibernate对lucene的集成进展。
请问hibernate对lucene的集成进展如何?在哪里可以查到?我同样很关注。 http://search.hibernate.org/ |
|
返回顶楼 | |
发表时间:2007-04-16
IndexWriter.updateDocument
可以更新而不是 delete/add了?? 这个可要好好研究一下,太重要了!! |
|
返回顶楼 | |
发表时间:2007-04-16
我现在就在学习这方面的知识。
期待有这方面的高人出现 |
|
返回顶楼 | |
发表时间:2007-04-27
从2.0到2.1.0的 变化还有segments文件名变成了segments.gen
|
|
返回顶楼 | |