`
chenhua_1984
  • 浏览: 1251801 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

SOLR的学习整理

    博客分类:
  • java
阅读更多

   

Apache Solr

    项目地址   http://lucene.apache.org/solr/,一个基于lucene的开源搜索项目,可以基于文本,数据库等分词建立索引,提供查询的API接口。

 

   SOLR项目下载下来大概30多M,默认采用JETTY作为APPSERVER,和TOMCAT类似的一个开源中间件软件。

 

   项目里面主要使用solr+oracle来实现全文搜索的查询,同样,也支持其他的关系型数据库。下面是基于ORACLE表格为数据源的配置。

  

   首先确认jetty的端口配置,有时候需要更改,可能端口已经被占用了。

 

 

 <Call name="addConnector">
      <Arg>
          <New class="org.mortbay.jetty.bio.SocketConnector">
            <Set name="port"><SystemProperty name="jetty.port" default="8989"/></Set>
            <Set name="maxIdleTime">50000</Set>
            <Set name="lowResourceMaxIdleTime">1500</Set>
          </New>
      </Arg>
 </Call>

 

   假如启动时报端口已经被占用的错误,那么需要更改成其他的端口。

 

   2配置data-config.xml文件,假如不存在,那么新建一个,放在目录solr/conf/data-config.xml下面。配置详情

 

<dataConfig>
  <dataSource 
	  driver="ENC(Ji+0Hu8V13iC0zBLfzu4bPZHjtDMpETcttc1ysa0y1maWD4rbpzXdQ\=\=)"
	  url="ENC(cAJkOTDUZcW2epqSuFcQHiVT0PnXaJo2/2E1rUbMMQMgb47SByMPS5mutQYpZmrSvES8DmRs2mk\=)"
	  user="ENC(K0EBhh8/VE0Hot+9ktQZOw\=\=)" 
	  password="ENC(z9let1hb06zgus/7PhReHg\=\=)"  
	  batchSize="100"
  />
  
  <document name="capaa_search">
<entity name="audit" pk="id" 
	query = "select 
solr_sequence.nextval as id
,lg_id
,SESSION#                                 
,to_char(timestamp,'yyyy-mm-dd&quot;T&quot;HH24:MI:SS&quot;Z&quot;') as timestamp     
,SCN                                      
,XID                                      
,SCHEMA_OBJECT                            
,OBJECT_TYPE                              
,COMMAND_TYPE                             
,SQLTEXT                                  
,ACTIONNAME                               
,AUDITLEVEL                               
,RETURNCODE                               
,ERRMSG                                   
,RESOLVED                                 
,REMARK                            
,RECNUMS                                  
,INST_ID                                  
,BIND_DATA                                
,END_IP                                   
,END_SESSION_INFO                         
,RULE_NAME                                   
,lg_audseq                                 
,USERID                                   
,UTYPE_ID                                 
,USERTYPE                                 
,DBUSER                                   
,OSUSER                                   
,APPUSER                                  
,REALUSER                                 
,IP_ADDRESS                               
,MAC_ADDRESS                              
,MACHINE                                  
,APP_NAME                                 
,APP_GNAME                                
,to_char(lg_timestamp,'yyyy-mm-dd&quot;T&quot;HH24:MI:SS&quot;Z&quot;') as lg_timestamp       
,to_char(LOGOFF_TIME,'yyyy-mm-dd&quot;T&quot;HH24:MI:SS&quot;Z&quot;') as logoff_time     
,LOGOFF_LREAD                             
,LOGOFF_PREAD                             
,LOGOFF_PWRITE                            
,SESSION_CPU                              
,SID                                      
,SERIAL#                                  
,SESSIONID                                
,CLIENT_ID                                
,CLIENT_INFO                              
,OS_PROCESS                               
,AUDIT_CLASS_ID                           
,AUDIT_CLASS                              
,AUDIT_LEVEL                              
,RETURN_CODE                              
,lg_errmsg                                   
,DBID                                     
,DBNAME                                   
,lg_resolved                                 
,lg_remark                                   
,lg_recnums                                  
,lg_inst_id                                  
,EUSER_NAME                                
,EGROUP_NAME                               
,EAREA_NAME                                
,ELEVEL_NAME                               
,lg_rule_name   
from
mc$asset_v_audit where ('${dataimporter.request.clean}' != 'false' OR last_modified &gt;= (to_date('${dataimporter.last_index_time}','YYYY-MM-DD HH24:MI:SS')))">
	<field column="TIMESTAMP" name="timestamp" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
	<field column="LG_TIMESTAMP" name="lg_timestamp" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
	<field column="LOGOFF_TIME" name="logoff_time" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
</entity>
 </document> 
</dataConfig>

 

 

 

 

 

 

 

 

 

这里主要是配置管理库的数据源,以及相关的SQL语句。

 

3 配置solrconfig.xml 文件

 

  <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
    	<str name="config">data-config.xml</str>
    </lst>
  </requestHandler>

 主要作用是载入上面的配置文件,有点类似web.xml的作用

 

4在浏览器中输入http://ip:port/solr/dataimport?command=full-import&clean=true 地址,回车,开始建立索引

 

5在导入过程中可以在浏览器中输入http://ip:port/solr/dataimport  来查看导入状态。

 

 

 

 

 

 6在浏览器中输入http://ip:port/solr/admin可以进入 solr的管理页面。

 

 

 

 

 

 

分享到:
评论
1 楼 zmwxiaoming 2016-09-12  
what 能连数据库不错

相关推荐

    JAVA+Solr分词项目工程实例Java实用源码整理learns

    描述中的“Java实用源码整理learns”表明这是一个学习资源,包含Java相关的实用代码,可能是为了帮助开发者理解如何在实际项目中整合Solr和Java。通过学习这些源码,开发者可以深入理解如何在Java应用中集成Solr,...

    Solr.In.Action目录整理版

    性能优化是Solr学习过程中一个不可忽视的部分。随着索引规模的增长,查询响应时间可能会变慢,影响用户体验。因此,书中可能会探讨如何通过优化查询参数、使用合适的分片策略、实现查询缓存、索引优化等措施来提高...

    solr开发应用教程

    同时,提供的“教程重要说明.txt”可能包含更多关于实践过程中的注意事项和常见问题的解答,配合“Solr 3.5开发应用教程-Linux公社(www.linuxidc.com)整理.pdf”阅读,能帮助你更深入地理解Solr的实战应用。...

    solr-5.3.0-src.tgz源码

    当前资源为Apache官方提供的solr-5.3.0-src.tgz源码,包括Lucene和solrj的源码,方便大家学习使用!此外还整理了一套有关solr-5.3.0的window和linux版包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的...

    solr-5.3.0.tgz Linux包

    当前资源为Apache官方提供的solr-5.3.0.tgz Linux包,方便大家学习使用!此外还整理了一套有关solr-5.3.0的window和src源码包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的可以去下载!

    solr-5.3.0.zip windows包

    当前资源为Apache官方提供的solr-5.3.0.zip windows包,方便大家学习使用!此外还整理了一套有关solr-5.3.0的Linux和src源码包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的可以去下载!

    Solr技术培训资料(基础知识+高级应用)。

    这是我整理的关于Solr的技术培训资料,它包含了关于Solr的基础知识和高级应用,例如分组、分词器、权重等问题,因为本人在学习solr时发现资源太少,所以整理了一些,当然由于本人技术不足,难免知识点不够全面,有...

    solr-wiki-zh:Apache Solr 官方wiki

    旨在方便大家学习和使用Solr,Solr官方wiki对很多技术细节介绍的非常完整详细,很多是官方手册并不包含的主题,而且很多页面很难找到,在首页的链接中找不到,本文档通过对官方wiki的翻译和整理,方便技术细节和关键...

    基于Dubbo、Solr、Redis、FastDFS、ssm、ActiveMQ、Zookeeper的SOA商城项目.zip

    项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松copy复刻,拿到资料包后可轻松复现出一样的项目,本人...收取的费用仅用于整理和收集资料耗费时间的酬劳 3. 积分资源不提供使用问题指导/解答

    我整理的搜索引擎学习和开发相关资料

    本文将深入探讨标题“我整理的搜索引擎学习和开发相关资料”中涉及的知识点,并结合描述及压缩包内的文件,提供一个全面的搜索引擎技术概述。 一、搜索引擎原理 "搜索引擎原理"这一主题涵盖了搜索引擎的基本工作...

    分享一个Nutch入门学习的资料

    压缩包中的“Nutch.pdf”可能是Nutch的官方文档、教程或者是博主整理的学习笔记。这份PDF文档通常会详细讲解Nutch的架构、工作流程、配置方法,以及一些示例和最佳实践。学习者可以通过阅读这份文档,系统地了解...

    大数据资料,自己整理的资料.rar

    "大数据资料,自己整理的资料.rar" 这个标题表明这是一个包含个人整理的大数据相关学习资源的压缩包。由于没有具体列出压缩包内的子文件名称,我们将基于一般大数据领域的常见知识点进行阐述。 大数据的核心概念...

    SpringBoot2NoSQL:一站式的NoSQL学习教程SpringBoot开发教程学习手册。包含SpringBoot2.0 + Redis,Ehcache,MongoDB,ElasticSearch,Cassandra,CouchBase,Solr,Neo4j,Gemfire共10种常用的NoSQL数据库操作,工具类,演示代码

    一站式SpringBoot for NoSQL开发教程学习手册。 含SpringBoot2.0 +: 雷迪斯 高速缓存 MongoDB 弹性搜索 卡桑德拉 CouchBase 索尔 Neo4j 宝石火 共9种常用NoSQL数据库操作,工具类,演示代码。用于整理日常常用...

    网站搜索的进化PPT学习教案.pptx

    网站搜索的进化是一个涵盖多个阶段和技术领域的话题,主要包括初期搜索技术、中期的全文检索引擎以及现代搜索网站的演进。...这不仅涉及到数据处理、检索算法,还涵盖了自然语言处理、机器学习等多个IT领域的专业知识。

    java+web项目实战大全源码搜索引擎源码整理

    在“Java+Web项目实战大全源码搜索引擎源码整理”中,我们主要关注的是使用Java编程语言进行Web项目的开发,特别是构建一个搜索引擎的实践过程。这个项目可能涉及到多个关键知识点,包括但不限于以下几点: 1. **...

    ASP在线查IP程序.rar_wap_全文检索_网站

    “各类数据采集”则暗示开发者可能具备数据抓取或爬虫技术,能够从互联网上自动收集和整理信息。这对于数据分析、市场研究或内容更新等场景非常有用。 综合以上信息,我们可以得出以下知识点: 1. ASP编程:了解...

    一些经典的项目模块合集;

    标题中的“一些经典的项目模块合集”表明这是一个包含多个不同技术模块的集合,可能是为了学习、参考或实际项目开发而整理的资源包。描述中提到的6个部分暗示了这个合集是多元化的,涵盖了Spring Security、AMQP、...

    2021最新java面试合集pdf.rar

    MongoDB学习笔记.docx mybatis原理.docx MyBatis面试专题.docx MyBatis面试专题及答案.pdf Mybatis面试题(含答案).pdf MySQL性能优化的21个最佳实践.pdf mysql面试专题.docx MySQL面试题(含答案).pdf Netty面试...

    殚精竭虑的同义词是什么.doc

    例如,在上述文档中,我们需要提取出所有含有近义词的成语,并将其整理成便于处理的形式。 **技术应用**: - **Python中的字符串操作**:使用Python中的字符串方法或正则表达式来实现。 - **自然语言处理工具**:...

Global site tag (gtag.js) - Google Analytics