mmseg4j分词器导致的java.lang.AbstractMethodError

alleni123

浏览: 382743 次
来自: 北京

最近访客更多访客>>

swx316

aininim

wangcaster

dongguangming88

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

lucene

lucene jar

java.lang.AbstractMethodError: org.apache.lucene.analysis.Analyzer.tokenStream(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;
at org.apache.lucene.analysis.Analyzer.reusableTokenStream(Analyzer.java:80)

<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-app</artifactId>
  <version>1.5</version>
</dependency>


		  <dependency>
			<groupId>com.chenlb.mmseg4j</groupId>
			<artifactId>mmseg4j-analysis</artifactId>
			<version>1.9.1</version>
		</dependency>
		
		<dependency>
	<groupId>com.chenlb.mmseg4j</groupId>
	<artifactId>mmseg4j-core</artifactId>
	<version>1.9.1</version>
</dependency>
            

 



		<dependency>
			<groupId>org.apache.lucene</groupId>
			<artifactId>lucene-core</artifactId>
			<version>3.5.0</version>
		</dependency>

		<dependency>
			<groupId>org.apache.lucene</groupId>
			<artifactId>lucene-highlighter</artifactId>
			<version>3.5.0</version>
		</dependency>

初步配置如上。
当使用MMSegAnalyzer, 就会报错。

java.lang.AbstractMethodError: org.apache.lucene.analysis.Analyzer.tokenStream(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;
at org.apache.lucene.analysis.Analyzer.reusableTokenStream(Analyzer.java:80)
at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:126)
at org.apache.lucene.index.DocFieldProcessorPerThread.processDocument(DocFieldProcessorPerThread.java:278)
at org.apache.lucene.index.DocumentsWriter.updateDocument(DocumentsWriter.java:766)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:2066)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:2040)
at org.apache.lucene.search.NRTManager.addDocument(NRTManager.java:214)
at com.lj.message.service.IndexService.addIndex(IndexService.java:66)

弄了半天，最后解决方法是使用下面的中文分词jar和上面的配置搭配。

貌似mvnrepository.com上没有。需要配置个nexus仓库。麻烦。

mmseg4j-all-1.8.5.jar (94.7 KB)
下载次数: 20

分享到：

使用tika解析各种类型的文本文件 | Connection is read-only. Queries leading ...

2014-04-07 17:08
浏览 2429
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论