`

Solr: Data Import Handler (DIH) with mysql

    博客分类:
  • Solr
 
阅读更多

The Handler has to be registered in the solrconfig.xml as follows.

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
      <str name="config">/home/username/data-config.xml</str>
    </lst>
  </requestHandler>

he configuration is provided in two places:

  • solrconfig.xml . The data config file location is added here
  • The datasource also can be added here. Or it can be put directly into the data-config.xml
  • data-config.xml
    • How to fetch data (queries,url etc)
    • What to read ( resultset columns, xml fields etc)
    • How to process (modify/add/remove fields)

 

 

Using query attribute for both full and delta import

can't work in solr4.7

 

 

schedule download http://pan.baidu.com/s/1c0in1By

 https://solr-dataimport-scheduler.googlecode.com/files/apache-solr-dataimportscheduler-1.1.jar

  http://blog.csdn.net/xintongfei/article/details/19171381

http://blog.csdn.net/ltr15036900300/article/details/23945515

 

 

date time type

http://www.niwozhi.net/demo_c82_i50518.html

Zulu time

http://www.timeanddate.com/library/abbreviations/timezones/military/z.html

 

deleted index that  docments deleted in mysql

http://stackoverflow.com/questions/12174115/deleting-unwanted-data-in-incremental-imports-when-using-solr-dih

http://solr.pl/en/2011/01/03/data-import-handler-%E2%80%93-removing-data-from-index/

 

http://blog.griddynamics.com/2013/09/solr-block-join-support.html

 

 

------------------

import xml to solr index

<dataConfig>
 <dataSource type="FileDataSource" encoding="utf-8"  />
  <document>
        <entity rootEntity="true" name="question" processor="XPathEntityProcessor" stream="true" forEach="/docs/doc/"  url="/home/tomcat/test/questionTags.xml">
           <field column="id" xpath="/docs/doc/id" />
           <field column="tags" xpath="/docs/doc/tags" />
           <field column="content" xpath="/docs/doc/content" />
       </entity>

    </document>
</dataConfig>

 

 

 

org.apache.solr.common.SolrException; null:java.lang.StackOverflowError

 

 

 

 

 

 

 

 

 

References

http://wiki.apache.org/solr/DataImportHandler

http://www.yeeach.com/post/1150

 

http://www.cnblogs.com/chenying99/archive/2012/09/08/2676208.html

http://lucene.472066.n3.nabble.com/DIH-deleting-documents-high-performance-delta-imports-and-passing-parameters-td1388349.html

 

http://www.solrcn.com/books/#72-en

分享到:
评论

相关推荐

    Solr3.6用DIH组件进行MySQL数据库全文索引[参照].pdf

    &lt;requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"&gt; &lt;str name="config"&gt;/solr/conf/data-config.xml ``` - 创建`data-config.xml`文件,该文件位于`solr/...

    图解Solr6.6.0安装与MySQL配置

    - 将MySQL的JDBC驱动程序和Solr Data Import Handler (DIH) 相关的JAR文件导入到`mycore/lib`目录中。 - MySQL驱动程序可以从官方Maven仓库下载:[http://mvnrepository.com/artifact/mysql/mysql-connector-java]...

    图解Solr5.3.1与MySQL配置【原创】

    1. **配置requestHandler**:使用`org.apache.solr.handler.dataimport.DataImportHandler`作为DIH。 2. **引入data-config.xml**:指定之前创建的`data-config.xml`文件,以便DIH能够根据该配置文件中的规则从MySQL...

    solr-4.9.0-安装部署文档

    - 配置 Solr 的 Data Import Handler(DIH)以连接 MySQL 数据库,这涉及到修改 Solr 的配置文件,如 managed-schema 或 schema.xml,以及在 Solr 的 DataConfig.xml 中定义数据源和查询语句。 完成以上步骤后,你...

    solr7.4数据库导入Demo(mysql数据库)

    &lt;requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"&gt; &lt;str name="config"&gt;data-config.xml ``` 接着,创建`data-config.xml`文件,定义数据源和数据实体。在...

    Solr技术分析及运用

    7. 数据导入处理(DataImport Handler, DIH): - DIH允许Solr从关系型数据库或其他数据源导入数据,建立索引。 - 在`solrconfig.xml`中配置数据源、查询语句和映射规则,以便Solr能读取和索引数据库中的数据。 ...

    apache-solr-dataimportscheduler

    &lt;processor class="org.apache.solr.handler.dataimport.DataImportHandlerRequestProcessorFactory"&gt; &lt;str name="command"&gt;full-import &lt;adminRequestHandler name="/admin/dataimport" /&gt; ...

    Solr配置入门教程

    `data-config.xml`则用于数据导入处理器(Data Import Handler, DIH),在这里配置与MySQL数据库的连接参数,以及要导入的数据表和查询语句。 4. **添加数据导入处理器库**:为了使用DIH,需要将`solr-...

    solr-8.2.0.rar

    为了整合MySQL,你需要在Solr的`server/solr/configsets/_default/conf`目录下创建一个名为`data-config.xml`的文件,这是数据导入 handler (DIH) 的配置文件。在此文件中,你需要定义数据源(这里是MySQL)以及数据...

    solr 应用全面解析.rar

    - **Solr Data Import Handler (DIH)**:文件“Solr Data Import 快速入门 - Bory_Chan.htm”可能涵盖了Solr的DIH特性,它是用于从外部数据源(如数据库)导入数据的工具。DIH支持多种数据源,如JDBC(Java ...

    dataimportscheduler-1.3.jar

    &lt;requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"&gt; &lt;str name="config"&gt;data-config.xml &lt;updateRequestProcessorChain name="dataimport"&gt; ...

    solrcloud6安装配置

    为了从数据库导入索引,我们需要安装Solr Data Import Handler (DIH)。将`solr-dataimporthandler-6.6.0.jar`拷贝到Solr的`lib`目录,同时还需要提供数据库驱动(如MySQL)。完成这些步骤后,可以通过Solr的DIH功能...

    solr运行配置与数据库数据导入到solr

    &lt;requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"&gt; &lt;str name="config"&gt;D:/solr-tomcat/solr/db/conf/db-data-config.xml ``` 7. **更新schema.xml**:...

    sorl企业级检索服务部署-快速检索

    SOLR支持多种方式导入数据,如使用HTTP POST提交JSON或XML文件,或者使用数据导入处理器(DIH,Data Import Handler)从关系型数据库中抽取数据。DIH支持多种数据库驱动,如MySQL、Oracle等,通过配置`data-config....

Global site tag (gtag.js) - Google Analytics