solr连接数据库配置 -

zihai367

浏览: 243214 次
性别:
来自: 北京

最近访客更多访客>>

soulliu

hbzht

u010469169

bronya

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

solr连接数据库配置

博客分类：

solr

solr

一般要搜索的信息都是被存储在数据库里面的，但是我们不能直接搜数据库，所以只有借助Solr将要搜索的信息在搜索服务器上进行索引，然后在客户端供客户使用。

一、链接数据库

1. SQL配置

拿SQL Server 为例，需要先下载Sql Server的jar包，下载地址：

http://msdn.microsoft.com/en-us/data/aa937724.aspx

解压缩之后将sqljdbc4.jar复制到webapps\solr\WEB-INF\lib下，也就是本例的：

D:\apache-tomcat-7.0.57\webapps\solr\WEB-INF\lib

2. 建立查询

然后在D:\apache-tomcat-7.0.57\webapps\solr\solr_home\collection1\conf下面新建一个配置文件：data-config.xml

然后在本目录下编辑配置文件：solrconfig.xml

找到很多个requestHandler节点，在最下面增加：

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport
.DataImportHandler"> 
    <lst name="defaults"> 
          <str name="config">D:\apache-tomcat-7.0.57\webapps\solr\solr_home\
collection1\conf\data-config.xml</str> 
    </lst> 
</requestHandler>

要配置的内容就是刚才新建文件的路径。

3. 将初次下载的solr-4.10.2文件夹下的dist, contrib文件夹复制到TomCat根目录下：

4. 然后再次修改刚才编辑过的solrconfig.xml增加两个文件夹的配置并修改一些参数：

大约在75行默认有8个路径，但是路径不一定全对，顺着这个配置的路径去找文件夹，根据查找的层数修改这个路径配置，另增加一个新的配置，全文如下：

  <lib dir="../../../../../contrib/extraction/lib" regex=".*\.jar" />

  <lib dir="../../../../../dist/" regex="solr-cell-\d.*\.jar" />

  <lib dir="../../../../../contrib/clustering/lib/" regex=".*\.jar" />

  <lib dir="../../../../../dist/" regex="solr-clustering-\d.*\.jar" />

  <lib dir="../../../../../contrib/langid/lib/" regex=".*\.jar" />

  <lib dir="../../../../../dist/" regex="solr-langid-\d.*\.jar" />

  <lib dir="../../../../../contrib/velocity/lib" regex=".*\.jar" />

  <lib dir="../../../../../dist/" regex="solr-velocity-\d.*\.jar" />

  <lib dir="../../../../../dist/" regex="solr-dataimporthandler-\d.*\.jar" />

这个配置是根据本机推导出来的，大家根据自己的实际情况去修改。

5. 将dist文件夹下的

复制到webapps\solr\WEB-INF\lib下。

6. 然后编辑

D:\apache-tomcat-7.0.57\webapps\solr\solr_home\collection1\conf\data-confing.xml文件，以本机MyBookShop数据库的Books表为例

配置如下：

<?xml version="1.0" encoding="UTF8"?> 
<dataConfig>
    <dataSource driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" 
  url="jdbc:sqlserver://localhost:1433;DatabaseName=MyBookShop" user="sa" password="111"/>
    <document name="Info" pk="id">
        <entity name="zpxx"  transformer="ClobTransformer" pk="id"
                 query="SELECT  [ID],[Title] as name  FROM [MyBookShop].[dbo].[Books]"       
                 deltaImportQuery="SELECT  [Id],[Title] as name  FROM
 [MyBookShop].[dbo].[Books] where [PublishDate] > '${dataimporter.last_index_time}'"   
                 deltaQuery="SELECT  id FROM [MyBookShop].[dbo].[Books] where 
 [PublishDate] > '${dataimporter.last_index_time}'">            
                    <field column="id"      name="id"      /> 
                    <field column="name"      name="name"      /> 
         </entity>
    </document>
</dataConfig>

此配置千万注意。

上述配置说明如下：

query是获取全部数据的SQL(solr从sql中获取那些数据)，多列

deltaImportQuery是获取增量数据时使用的SQL(数据库新增数据追加到solr的数据)，多列

deltaQuery是获取pk的SQL(数据库新增数据是,追加到solr的数据时的条件,根据id ,条件是最后一次获取的时间,${dataimporter.last_index_time,最后获取的时间})，一列

保证SQL SERVER配置了外网访问即可。

配置到此基本结束。

二、建立索引

启动Solr，删除全部索引数据：

http://localhost:8080/solr/update/?stream.body=<delete><query>*:*</query></delete>&stream.contentType=text/xml;charset=utf-8&commit=true

http://127.0.0.1:8080/solr-4.8.1/update/?stream.body=<delete><query>*:*</query></delete>&stream.contentType=text/xml;charset=utf-8&commit=true

停掉Solr，检查下是不是清空了：

开始创建新的索引，浏览器执行方式:

终止跑索引：http://localhost:8080/solr/collection1/dataimport?command=abort

开始索引：http://localhost:8080/solr/collection1/dataimport?command=full-import

增量索引：http://localhost:8080/solr/collection1/dataimport?command=delta-import

建议学习时使用UI的方式进行更新，能看清运行过程：

需要等执行结束，可以点击【Refrush status】看结果：

Indexing completed. Added/Updated: 1076 documents. Deleted 0 documents. (Duration: 03s)

表示结束。

然后点击左边的查询检验索引结果：

出现查询结果表示创建成功。

三、更新索引、增加索引、删除索引

1. 更新数据：

我们先来搜索一个关键字“土豆”，这里全是计算机图书，不应该有土豆的。

然后将其中一个书籍的标题更新为“论土豆的栽培技术”

不更新索引是搜不到的。

执行增量更新：

http://localhost:8080/solr/dataimport?command=delta-import&clean=false&commit=true

然后去查询：

已经可以查询得到了。

2. 新增一个数据：“论苹果的艺术”

insert into [MyBookShop].[dbo].[Books]

(

[Title]
,[Author]
,[PublishDate]
,[WordsCount]
,[UnitPrice]
,[ContentDescription]
,[AurhorDescription]
,[EditorComment]
,[TOC]
)
SELECT '论苹果的艺术'
,[Author]
,[PublishDate]
,[WordsCount]
,[UnitPrice]
,[ContentDescription]
,[AurhorDescription]
,[EditorComment]
,[TOC]
FROM [MyBookShop].[dbo].[Books] where id=4942