The Handler has to be registered in the solrconfig.xml as follows.
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">/home/username/data-config.xml</str> </lst> </requestHandler>
he configuration is provided in two places:
- solrconfig.xml . The data config file location is added here
- The datasource also can be added here. Or it can be put directly into the data-config.xml
- data-config.xml
- How to fetch data (queries,url etc)
- What to read ( resultset columns, xml fields etc)
- How to process (modify/add/remove fields)
Using query attribute for both full and delta import
can't work in solr4.7
schedule download http://pan.baidu.com/s/1c0in1By
https://solr-dataimport-scheduler.googlecode.com/files/apache-solr-dataimportscheduler-1.1.jar
http://blog.csdn.net/xintongfei/article/details/19171381
http://blog.csdn.net/ltr15036900300/article/details/23945515
date time type
http://www.niwozhi.net/demo_c82_i50518.html
Zulu time
http://www.timeanddate.com/library/abbreviations/timezones/military/z.html
deleted index that docments deleted in mysql
http://stackoverflow.com/questions/12174115/deleting-unwanted-data-in-incremental-imports-when-using-solr-dih
http://solr.pl/en/2011/01/03/data-import-handler-%E2%80%93-removing-data-from-index/
http://blog.griddynamics.com/2013/09/solr-block-join-support.html
------------------
import xml to solr index
<dataConfig> <dataSource type="FileDataSource" encoding="utf-8" /> <document> <entity rootEntity="true" name="question" processor="XPathEntityProcessor" stream="true" forEach="/docs/doc/" url="/home/tomcat/test/questionTags.xml"> <field column="id" xpath="/docs/doc/id" /> <field column="tags" xpath="/docs/doc/tags" /> <field column="content" xpath="/docs/doc/content" /> </entity> </document> </dataConfig>
org.apache.solr.common.SolrException; null:java.lang.StackOverflowError
References
http://wiki.apache.org/solr/DataImportHandler
http://www.yeeach.com/post/1150
http://www.cnblogs.com/chenying99/archive/2012/09/08/2676208.html
http://lucene.472066.n3.nabble.com/DIH-deleting-documents-high-performance-delta-imports-and-passing-parameters-td1388349.html
http://www.solrcn.com/books/#72-en
相关推荐
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <str name="config">/solr/conf/data-config.xml ``` - 创建`data-config.xml`文件,该文件位于`solr/...
- 将MySQL的JDBC驱动程序和Solr Data Import Handler (DIH) 相关的JAR文件导入到`mycore/lib`目录中。 - MySQL驱动程序可以从官方Maven仓库下载:[http://mvnrepository.com/artifact/mysql/mysql-connector-java]...
1. **配置requestHandler**:使用`org.apache.solr.handler.dataimport.DataImportHandler`作为DIH。 2. **引入data-config.xml**:指定之前创建的`data-config.xml`文件,以便DIH能够根据该配置文件中的规则从MySQL...
- 配置 Solr 的 Data Import Handler(DIH)以连接 MySQL 数据库,这涉及到修改 Solr 的配置文件,如 managed-schema 或 schema.xml,以及在 Solr 的 DataConfig.xml 中定义数据源和查询语句。 完成以上步骤后,你...
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <str name="config">data-config.xml ``` 接着,创建`data-config.xml`文件,定义数据源和数据实体。在...
7. 数据导入处理(DataImport Handler, DIH): - DIH允许Solr从关系型数据库或其他数据源导入数据,建立索引。 - 在`solrconfig.xml`中配置数据源、查询语句和映射规则,以便Solr能读取和索引数据库中的数据。 ...
<processor class="org.apache.solr.handler.dataimport.DataImportHandlerRequestProcessorFactory"> <str name="command">full-import <adminRequestHandler name="/admin/dataimport" /> ...
`data-config.xml`则用于数据导入处理器(Data Import Handler, DIH),在这里配置与MySQL数据库的连接参数,以及要导入的数据表和查询语句。 4. **添加数据导入处理器库**:为了使用DIH,需要将`solr-...
为了整合MySQL,你需要在Solr的`server/solr/configsets/_default/conf`目录下创建一个名为`data-config.xml`的文件,这是数据导入 handler (DIH) 的配置文件。在此文件中,你需要定义数据源(这里是MySQL)以及数据...
- **Solr Data Import Handler (DIH)**:文件“Solr Data Import 快速入门 - Bory_Chan.htm”可能涵盖了Solr的DIH特性,它是用于从外部数据源(如数据库)导入数据的工具。DIH支持多种数据源,如JDBC(Java ...
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <str name="config">data-config.xml <updateRequestProcessorChain name="dataimport"> ...
为了从数据库导入索引,我们需要安装Solr Data Import Handler (DIH)。将`solr-dataimporthandler-6.6.0.jar`拷贝到Solr的`lib`目录,同时还需要提供数据库驱动(如MySQL)。完成这些步骤后,可以通过Solr的DIH功能...
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <str name="config">D:/solr-tomcat/solr/db/conf/db-data-config.xml ``` 7. **更新schema.xml**:...
SOLR支持多种方式导入数据,如使用HTTP POST提交JSON或XML文件,或者使用数据导入处理器(DIH,Data Import Handler)从关系型数据库中抽取数据。DIH支持多种数据库驱动,如MySQL、Oracle等,通过配置`data-config....