`

庖丁解牛 lucene3.0.2兼容问题(转)

    博客分类:
  • java
阅读更多

 

http://code.google.com/p/paoding/issues/detail?id=49

 

 

 

 

Reported by project member reno.gan, Dec 03, 2009
lucene 3.0 去掉了一些废弃的方法,如tokenStream.next()方法。为了让Paoding能
够在lucene 3.0环境运行,我改动了附件中的三个文件,主要是为了兼容新的
tokenStream.incrementToken()接口。
PaodingTokenizer.java
5.7 KB   View   Download
TokenCollector.java
1004 bytes   View   Download
Estimate.java
5.1 KB   View   Download
Comment 1 by stt...@163.com, Jul 08, 2010
请问能标明你改动了哪些地方吗?
Comment 2 by stt...@163.com, Jul 08, 2010
我现在的版本是lucene3.0.2,加入这三个文件依然报:
Exception in thread "main" java.lang.NullPointerException
	at net.paoding.analysis.analyzer.PaodingTokenizer.close(PaodingTokenizer.java:164)
	at org.apache.lucene.queryParser.QueryParser.getFieldQuery(QueryParser.java:571)
	at org.apache.lucene.queryParser.QueryParser.Term(QueryParser.java:1362)
	at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1250)
	at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1178)
	at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1167)
	at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:182)
	at test.TestBoBo.main(TestBoBo.java:44)
Comment 3 by hjbin333, Jul 13, 2010
把paoding的PaodingTokenizer类的164行注释掉,就不会报错,已经在lucene3.0.2试过
		super.close();
//		input.close();//这句导致报错

 

-

 

 

http://code.google.com/p/paoding/issues/detail?id=49

分享到:
评论

相关推荐

    lucene 中文分词 庖丁解牛

    《Lucene中文分词:庖丁解牛》 在信息技术高速发展的今天,全文搜索引擎已经成为网站内容检索不可或缺的一部分。其中,Apache Lucene作为一个开源的全文检索库,被广泛应用于各种项目中,尤其对于处理中文文本,...

    lucene中文分词(庖丁解牛)庖丁分词

    《Lucene中文分词——庖丁解牛》 在自然语言处理领域,中文分词是基础且关键的一环。在Java开发中,Apache Lucene是一个强大的全文搜索引擎库,但默认并不支持中文,这就需要借助第三方分词工具。本文将深入探讨...

    Lucene 庖丁解牛分词法2.4版本jar包

    《深入剖析Lucene:庖丁解牛分词法2.4版本》 在中文信息处理领域,Lucene作为一个强大的全文检索引擎库,扮演着至关重要的角色。然而,由于中文的复杂性,简单的英文分词策略无法满足需求,于是有了针对中文的分词...

    lucene3.0.2 jar包

    博客上的例子用到的LUCENE3.0.2版本的jar包

    lucene-3.0.2.zip

    lucene-3.0.2.zip lucene-3.0.2.zip

    lucene3.0 整合庖丁解牛实例

    实例是一个java实例,可直接导入到MyEclipse中...其中是lucene3.0整合了庖丁解牛分词法,添加了高亮显示。因为lucene3.0无法整合paoding-analysis.jar 所以我已经把paoding-analysis中的源码整合进来了避免无法整合问题

    庖丁解牛工具

    而"庖丁解牛"则为Lucene提供了针对中文的分词支持,使得开发者可以更好地处理中文文档,提高了搜索的准确性和效率。它的特点包括对中文词汇的精准识别,对新词的动态学习,以及对多音字、成语和网络用语的有效处理。...

    Lucene 3.0.2 API DOC

    Lucene 3.0.2 API DOC CHM 是开发的必备工具之一

    庖丁解牛 源码 for Lucene 2.4

    《庖丁解牛 源码 for Lucene 2.4》是一份针对开源全文搜索引擎Lucene 2.4版本的深度解析资料。这个压缩包包含的文件名为"paoding-for-lucene-2.4",很可能是针对中文处理的Paoding Lucene库的源代码分析或扩展。...

    lucene3.0.2

    lucene3.0.2包含lucene-analyzers-3.0.2.jar,lucene-core-3.0.2.jar,lucene-highlighter-3.0.2.jar,lucene-memory-3.0.2.jar等jar包使用lucene实现分词搜索

    lucene3庖丁解牛中文分词器

    《深入剖析:Lucene3与庖丁解牛中文分词器》 在信息技术飞速发展的今天,全文检索和搜索引擎已经成为日常开发中不可或缺的部分。Lucene作为一款强大的全文检索库,被广泛应用于各种信息检索系统中。然而,对于中文...

    lucene3.0.2jar包

    《深入解析Lucene 3.0.2:Java全文搜索引擎的核心技术》 Lucene是一个开源的、基于Java的全文搜索引擎库,它为开发者提供了构建高效、可扩展的搜索功能所需要的核心工具。在3.0.2这个版本中,Lucene已经经过了多次...

    lucene 3.0.2

    lucene library. lucene-demos-XX.jar The compiled simple example code. luceneweb.war The compiled simple example Web Application. contrib/* Contributed code which extends and enhances Lucene, but...

    lucene 3.0.2 core+src+javadoc

    《Apache Lucene 3.0.2:全文搜索的核心与深度探索》 Apache Lucene 是一个高度可扩展的开源全文搜索引擎库,它为开发者提供了在应用程序中实现复杂搜索功能的基础框架。版本3.0.2是这个项目的一个里程碑,包含了...

    paoding analysis 3.0.1 jar (庖丁解牛分词器)

    由于庖丁官方目前提供可下载尚不支持Lucene 3.0以上版本。因此作者对paoding进行重新编译,使其与最新Lucene 3.0.1版本适用。 Latest paoding 3.0.1 for lucene 3.0.1 使用说明: 先下载2.0.4的版本(h t t p : / ...

    Lucene加庖丁解牛测试类

    本文将深入探讨“Lucene加庖丁解牛测试类”,旨在帮助读者理解Lucene的核心概念,并通过实际的测试类解析,提升对Lucene的运用能力。 首先,我们需要理解“庖丁解牛”的含义。这源自古代典故,意指做事技艺娴熟,能...

    庖丁解牛,一种中文分词器

    "庖丁解牛"分词器采用了先进的算法和技术来解决这个问题,包括基于词典的匹配、上下文信息分析以及统计学习方法等,使得它在处理中文文本时表现出了较高的准确性和效率。 "Lucene"是一个流行的开源全文搜索引擎库,...

    lucene-core-3.0.2.jar,lucene-demos-3.0.2.jar

    《深入理解Lucene 3.0.2:核心与演示》 在信息技术领域,搜索引擎的构建是至关...然而,随着技术的不断发展,后续的版本(如6.x、8.x)带来了更多的改进和新特性,开发者在选择时也应考虑到版本的更新和兼容性问题。

    Lucene3.0以上版本庖丁解牛分词法demo

    最新庖丁解牛分词法的使用demo,支持Lucene3.3、3.4等3.0以上版本,庖丁解牛的分词包为自己编译生成的,之前的2.0的版本不能支持Lucene3.0以上版本,所以需要从svn下载最新的庖丁解牛源码,生成jar文件(我同样已...

Global site tag (gtag.js) - Google Analytics