Nutch2 + Solr 6: solrdedup causes ClassCastException

silly_sinba

浏览: 130095 次
性别:
来自: 成都

最近访客更多访客>>

llllmnglf

lbyzx123

chenmfly

Jan111

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Nutch

Error running:

/mnt/nutch/nutch/runtime/local/bin/nutch solrdedup -D mapred.reduce.tasks=2 -D mapred.child.java.opts=-Xmx1000m -D mapred.reduce.tasks.speculative.execution=false -D mapred.map.tasks.speculative.execution=false -D mapred.compress.map.output=true http://localhost:8983/solr/nutch

Failed with exit value 1.

hadoop.log ：

java.lang.Exception: java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.String

at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)

at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)

Caused by: java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.String

at org.apache.nutch.indexer.solr.SolrDeleteDuplicates$SolrRecordReader.nextKeyValue(SolrDeleteDuplicates.java:233)

at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:533)

at org.apache.hadoop.mapreduce.task.MapContextImpl.nextKeyValue(MapContextImpl.java:80)

这个报错在solr5，6都存在。参考的解决方案见这里：

http://lucene.472066.n3.nabble.com/Nutch-2-Solr-5-solrdedup-causes-ClassCastException-td4301149.html#a4302739

1）将solr-6.6.0/server/solr/configsets目录下的data_driven_schema_configs复制一份到原目录下，并重命名为nutch

2）$NUTCH_HOME/conf下的schema.xml复制到server/solr/configsets/nutch/conf下。

3）将server/solr/configsets/nutch/conf/schema.xml文件中的enablePositionIncrements删掉。

4）执行命令创建core：

solr create -c nutch -d nutch

解释：[-c name] [-d confdir]

这里的nutch分别是core的名字和上面指定的conf的名字

成功了会看到这样的输入：

Zhuos-MacBook-Pro:solr-6.6.0 jo$ solr create -c nutch -d nutch

Copying configuration to new core instance directory:

/Users/jo/soft/solr-5.5.4/server/solr/nutch

Creating new core 'nutch' using command:

http://localhost:8983/solr/admin/cores?action=CREATE&name=nutch&instanceDir=nutch

{

"responseHeader":{

"status":0,

"QTime":107},

"core":"nutch"}

如果报错：ERROR: Error CREATEing SolrCore 'nutch': Unable to create core [nutch] Caused by: fieldType 'tdates' not found in the schema

这里可以是tdates或者其他的..可以对比下server/solr/configsets/nutch/conf目录下的schema.xml和managed-schema两个文件。tdates应该是在managed-schema文件中用到了，却没有在schema.xml中定义。因此将managed-schema中tdates的定义拷贝到schema.xml中。例如下面这段我是从managed-schema中找到的，然后拷贝到了schema.xml中：

    <fieldType name="tints" class="solr.TrieIntField" docValues="true" precisionStep="8" positionIncrementGap="0" multiValued="true"/>
    <fieldType name="tfloats" class="solr.TrieFloatField" docValues="true" precisionStep="8" positionIncrementGap="0" multiValued="true"/>
    <fieldType name="tlongs" class="solr.TrieLongField" docValues="true" precisionStep="8" positionIncrementGap="0" multiValued="true"/>
    <fieldType name="tdoubles" class="solr.TrieDoubleField" docValues="true" precisionStep="8" positionIncrementGap="0" multiValued="true"/>

这下应该没什么问题了。

分享到：

Nutch2 + Solr 6: This IndexSchema is no ... | Nutch 1.13 + Solr 5.5.4集成常见报错

2017-06-23 00:34
浏览 896
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论