配置Paoding分词时出现的错误:java.lang.AbstractMethodError:
org.apache.lucene.analysis.TokenStream.incrementToken()
在使用
lucene3与paoding集成的时候可能会出现以下错误:
Exception
in thread "main" java.lang.AbstractMethodError:
org.apache.lucene.analysis.TokenStream.incrementToken()Z
at
org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:137)
at
org.apache.lucene.index.DocFieldProcessorPerThread.processDocument(DocFieldProcessorPerThread.java:246)
at
org.apache.lucene.index.DocumentsWriter.updateDocument(DocumentsWriter.java:774)
at
org.apache.lucene.index.DocumentsWriter.addDocument(DocumentsWriter.java:752)
at
org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1932)
at
org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1906)
原因
是:paoding以前发布的jar与lucene3不兼容,而与
lucene3兼容的jar还没发布,只发布了源代码,所以在项目中通过源代码的项目加入paoding,而不是jar包,这样就能避免此错误。
与
lucene3兼容的paoding 源代码下载地址:
http://paoding.googlecode.com/svn/trunk/paoding-analysis/
需要使
用SVN下载。
"庖丁
解牛"google 论坛:
http://groups.google.com/group/paoding
旧版本
地址:
http://paoding.googlecode.com/svn/trunk/paoding-analysis-1/
不
建议下载旧版本
转自:http://blog.csdn.net/Ccode/archive/2010/09/23/5901762.aspx
分享到:
相关推荐
Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementToken()Z 换用svn里源码版正常 http://paoding.googlecode.com/svn/trunk/paoding-analysis/
Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.TokenStream.incrementToken()Z at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField....
paoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jar
《Lucene与Paoding分词在索引构建中的应用》 Lucene,作为一款开源的全文检索库,被广泛应用于各种信息检索系统中,而Paoding分词则是针对中文进行高效精准分词的工具,两者结合能显著提升中文文本检索的效率和准确...
《Lucene中文分词器——Paoding解牛详解》 在中文信息检索领域,分词是至关重要的一环,它能够将连续的汉字序列切割成具有独立意义的词语,为后续的索引和查询提供基础。Lucene作为Java最著名的全文搜索引擎库,其...
paoding可方便地与Lucene、Solr等全文检索引擎集成,提供高性能的中文分词服务。 总结来说,paoding分词是一个强大的中文分词工具,其高效、灵活的特性使得它在众多分词库中脱颖而出。通过理解其工作原理和熟练...
庖丁(PaoDing)是一款专为Java平台设计的中文文本分词工具,它在中文文本处理领域具有较高的性能和准确性。分词是自然语言处理中的基础步骤,对于中文而言,由于没有明显的空格来区分单词,因此需要通过特定算法将...
在本项目中,我们利用Java编程语言调用了Paoding分词器来处理抓取到的XML格式的新闻数据。Paoding分词器是一款高效的中文分词工具,它为Java开发者提供了方便的接口,用于实现对中文文本的智能分析,特别适合于海量...
3. **查询处理**:当用户输入查询时,同样使用Paoding对查询字符串进行分词,然后在Lucene的索引中查找匹配的文档。 4. **结果返回**:根据匹配程度和相关性算法,Lucene会返回最相关的搜索结果。 在实际应用中,...
**Java分词技术详解——以Paoding Analysis 2.0.4 Alpha2为例** 在中文信息处理领域,分词是至关重要的一步,它涉及到搜索引擎、文本挖掘、机器翻译等多个应用场景。Java作为广泛应用的编程语言,提供了多种优秀的...
"paoding-analysis3.0.jar" 是一个针对 Lucene 核心库的中文分词组件,主要用于提升中文文本处理的效率和准确性。Lucene 是一个流行的开源全文搜索引擎库,广泛应用于信息检索、网站搜索和大数据分析等领域。在 ...
Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词...
基于Lucene4.x实现Paoding分词器.rar
Paoding中文分词库是一个使用Java开发的基于Lucene4.x的分词器,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为...
修改了paoding-analysis6的部分源码,使之支持lucene6.2.1
1. 引入 Lucene 核心库和 Paoding 分词器的 jar 包到项目中,例如 `lucene-core-3.1.0.jar` 和 `paoding-analysis.jar`。 2. 在项目中配置 Paoding 分词器的相关参数,设置好词典文件的路径。 3. 在索引文档之前,...
在实际应用中,"paoding_analysis.rar"这个压缩包很可能包含了实现这一功能所需的全部资源和配置文件,例如分词词典、样例代码以及相关的文档说明。文件名中的"lucene paoding paodi"标签,暗示了这是关于Lucene使用...
4. `paoding-analysis.jar`:这是核心的Java归档文件,包含了Paoding中文分词的代码和库,可以在Java环境中运行。 5. `dic`:可能是一个目录,存储了分词所需的词典文件,用于确定词汇及其边界。 6. `examples`:...
【Lucene Demo (Paoding)】是一个展示如何在Java环境中使用Apache Lucene库进行全文搜索引擎构建的示例项目。Lucene是开源的全文检索引擎库,它提供了强大的文本搜索功能,而Paoding则是针对中文处理的插件,优化了...