- 浏览: 1254112 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (399)
- 心情故事 (12)
- java (115)
- linux (55)
- 关系型数据库 (35)
- struts,jsf,spring (11)
- jdbc,hibernate,ibatis (11)
- jsp,jstl,c:tag,标签库 (2)
- ejb,webservice (1)
- tomcat,jboss,jetty,weblogic,websphere (15)
- java网络编程 (6)
- java线程 (0)
- js,jquery,json,xml,dom,html.regex (25)
- 设计模式 (6)
- BUG记录 (2)
- ant (2)
- jsp,servlet (4)
- swing (6)
- lucene+nutch (6)
- log4j (2)
- windows doc (2)
- ruby (1)
- ruby on rails (3)
- 操作系统网络 (18)
- apache 错误 (1)
- tomcat (10)
- jboss (9)
- jetty (9)
- weblogic (9)
- websphere (10)
- apache (2)
- AIX的iostat命令查看系统磁盘的使用情况 (1)
- oracle 统计一个表格有多少列 (1)
- Exception in thread "main" java.security.KeyStoreException: Windows-MY not found (1)
- jsp (1)
- jstl (1)
- c:tag (1)
- 标签库 (1)
- struts (1)
- jsf (1)
- spring (2)
- oracle,sqlplus (2)
- sqlplus (2)
- show errors (1)
- proc (1)
- function (1)
- ORA-06544: PL/SQL: internal error (1)
- arguments: [55916] (1)
- [] (7)
- 终端身份实施文档 (1)
- 重装系统之后飞鸽传书只能看到自己 (1)
- vsftp "上传 553 Could not create file" (1)
- startWebLogic.sh启动失败,提示Error initializing Embedded LDAP Server (1)
- java agent 注册为 windows 服务 (1)
- centos (1)
- svn (1)
- apr (1)
- apr-util (1)
- activemq (2)
- oracle (5)
- mysql (3)
- nosql (3)
- NSIS (1)
- windows wmic (1)
- c 指针 (1)
- c c++ (0)
- jmeter (0)
- 性能测试 (0)
- linux,备份 (2)
- C++ ,Virtual (1)
- windows dos (1)
- android (2)
- 大数据,云计算 (1)
- JVM垃圾收集 (1)
- jdbc (2)
- invoke (1)
- hibernate (1)
- ibatis (1)
- 个人开源项目源码收藏 (1)
- 批处理 (1)
- Mongodb mapreduce (8)
- kettle (1)
- Mongodb capped (1)
- mongodb gridfs (1)
- Mongodb 入门基础知识 (1)
- mongodb (8)
- hadoop2.5.1 (1)
- hadoop (4)
- eclipse (1)
- hdfs fs (1)
- elipse hadoop plugin (1)
- PHP相关知识 (1)
- js (1)
- jquery (1)
- json (1)
- xml (1)
- dom (1)
- html.regex (1)
- 网络知识 (1)
- nginx (1)
- docker (1)
- 测试 (1)
- nodejs (1)
- iptables (1)
- linux gitlab (1)
最新评论
-
July01:
最近了解到一款StratoIO打印控件,功能如下:1、Html ...
web页面调用window.print()函数实现打印的功能 -
hxdtech:
非常感谢!
我在学习ibatis时的培训ppt -
zmwxiaoming:
what 能连数据库不错
SOLR的学习整理 -
springdata_springmvc:
java程序语言学习教程 地址http://www.zuida ...
java获取当前操作系统的信息 -
huanzei:
整理的不错,
oracle lpad函数
Apache Solr
项目地址 http://lucene.apache.org/solr/,一个基于lucene的开源搜索项目,可以基于文本,数据库等分词建立索引,提供查询的API接口。
SOLR项目下载下来大概30多M,默认采用JETTY作为APPSERVER,和TOMCAT类似的一个开源中间件软件。
项目里面主要使用solr+oracle来实现全文搜索的查询,同样,也支持其他的关系型数据库。下面是基于ORACLE表格为数据源的配置。
首先确认jetty的端口配置,有时候需要更改,可能端口已经被占用了。
<Call name="addConnector"> <Arg> <New class="org.mortbay.jetty.bio.SocketConnector"> <Set name="port"><SystemProperty name="jetty.port" default="8989"/></Set> <Set name="maxIdleTime">50000</Set> <Set name="lowResourceMaxIdleTime">1500</Set> </New> </Arg> </Call>
假如启动时报端口已经被占用的错误,那么需要更改成其他的端口。
2配置data-config.xml文件,假如不存在,那么新建一个,放在目录solr/conf/data-config.xml下面。配置详情
<dataConfig>
<dataSource
driver="ENC(Ji+0Hu8V13iC0zBLfzu4bPZHjtDMpETcttc1ysa0y1maWD4rbpzXdQ\=\=)"
url="ENC(cAJkOTDUZcW2epqSuFcQHiVT0PnXaJo2/2E1rUbMMQMgb47SByMPS5mutQYpZmrSvES8DmRs2mk\=)"
user="ENC(K0EBhh8/VE0Hot+9ktQZOw\=\=)"
password="ENC(z9let1hb06zgus/7PhReHg\=\=)"
batchSize="100"
/>
<document name="capaa_search">
<entity name="audit" pk="id"
query = "select
solr_sequence.nextval as id
,lg_id
,SESSION#
,to_char(timestamp,'yyyy-mm-dd"T"HH24:MI:SS"Z"') as timestamp
,SCN
,XID
,SCHEMA_OBJECT
,OBJECT_TYPE
,COMMAND_TYPE
,SQLTEXT
,ACTIONNAME
,AUDITLEVEL
,RETURNCODE
,ERRMSG
,RESOLVED
,REMARK
,RECNUMS
,INST_ID
,BIND_DATA
,END_IP
,END_SESSION_INFO
,RULE_NAME
,lg_audseq
,USERID
,UTYPE_ID
,USERTYPE
,DBUSER
,OSUSER
,APPUSER
,REALUSER
,IP_ADDRESS
,MAC_ADDRESS
,MACHINE
,APP_NAME
,APP_GNAME
,to_char(lg_timestamp,'yyyy-mm-dd"T"HH24:MI:SS"Z"') as lg_timestamp
,to_char(LOGOFF_TIME,'yyyy-mm-dd"T"HH24:MI:SS"Z"') as logoff_time
,LOGOFF_LREAD
,LOGOFF_PREAD
,LOGOFF_PWRITE
,SESSION_CPU
,SID
,SERIAL#
,SESSIONID
,CLIENT_ID
,CLIENT_INFO
,OS_PROCESS
,AUDIT_CLASS_ID
,AUDIT_CLASS
,AUDIT_LEVEL
,RETURN_CODE
,lg_errmsg
,DBID
,DBNAME
,lg_resolved
,lg_remark
,lg_recnums
,lg_inst_id
,EUSER_NAME
,EGROUP_NAME
,EAREA_NAME
,ELEVEL_NAME
,lg_rule_name
from
mc$asset_v_audit where ('${dataimporter.request.clean}' != 'false' OR last_modified >= (to_date('${dataimporter.last_index_time}','YYYY-MM-DD HH24:MI:SS')))">
<field column="TIMESTAMP" name="timestamp" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
<field column="LG_TIMESTAMP" name="lg_timestamp" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
<field column="LOGOFF_TIME" name="logoff_time" xpath="/RDF/item/date" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'"/>
</entity>
</document>
</dataConfig>
这里主要是配置管理库的数据源,以及相关的SQL语句。
3 配置solrconfig.xml 文件
主要作用是载入上面的配置文件,有点类似web.xml的作用 4在浏览器中输入http://ip:port/solr/dataimport?command=full-import&clean=true 地址,回车,开始建立索引 5在导入过程中可以在浏览器中输入http://ip:port/solr/dataimport 来查看导入状态。
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
6在浏览器中输入http://ip:port/solr/admin可以进入 solr的管理页面。
发表评论
-
centos6.5 hadoop伪分布式搭建
2017-01-10 10:41 25打算整理下machine learn ,再次安装 ... -
springboot
2016-12-29 11:13 2392微服务,现在是一个越来越热的东西,软件架构发展到 ... -
elk安装记录
2016-12-27 18:04 987在centos6.5上安装elk,记录下安装过程和 ... -
dubbo服务框架
2016-12-23 15:40 485上一篇文章介绍了zookeeper,作为服务 ... -
zookeeper服务注册中心配置
2016-12-22 11:40 1668用zookeeper有一段时间了,把配置做下简 ... -
OS X 安装java开发环境
2016-12-03 23:29 602... -
关于Restful API 的设计
2015-06-12 13:32 2282Restful API的流行,很大程度上被当前的移动 ... -
Jvisualvm远程连接tomcat配置:
2015-05-12 16:16 786JvisualVm 监控远程Tomcat,需要在To ... -
jdbc mybatis hibernate springJDBC的一些理解
2015-01-15 17:10 7070... -
Java 的ExecutorService
2015-01-15 11:45 1227早期在Java5以前,我们做多线程程序,一般都 ... -
spring的IOC和AOP
2015-01-14 16:47 2358关于Spring,大家都是耳熟 ... -
java 的线程安全
2014-12-30 14:43 977现代CPU基本都是多核,支持 ... -
JVM ClassLoader
2014-12-25 16:33 946JVM在加载类的时候,都是通过ClassLoad ... -
minor Gc ,Full Gc
2014-12-24 17:22 2107在发生Minor gc之前,虚拟机会先检查老年带最 ... -
Java的主要垃圾回收器
2014-12-24 16:33 1312对象 ... -
JVM的内存结构的一点理解
2014-12-24 11:30 783... -
利用生产者消费者模式实现串行的任务并行化
2014-12-22 17:48 1238试想,一个省有100个处理节点需要 ... -
利用生产者消费者模式实现串行的任务并行化
2014-12-22 17:48 0试想,一个省有100个处理节点需要 ... -
关于Linux的Ulimit参数
2014-12-22 12:13 1282JVM 64位平台与32位平台 ... -
一种表格数据比对的方法
2014-12-19 16:59 1056假设有连个库,一个是生产库,一个是备份库,在一个特 ...
相关推荐
描述中的“Java实用源码整理learns”表明这是一个学习资源,包含Java相关的实用代码,可能是为了帮助开发者理解如何在实际项目中整合Solr和Java。通过学习这些源码,开发者可以深入理解如何在Java应用中集成Solr,...
性能优化是Solr学习过程中一个不可忽视的部分。随着索引规模的增长,查询响应时间可能会变慢,影响用户体验。因此,书中可能会探讨如何通过优化查询参数、使用合适的分片策略、实现查询缓存、索引优化等措施来提高...
同时,提供的“教程重要说明.txt”可能包含更多关于实践过程中的注意事项和常见问题的解答,配合“Solr 3.5开发应用教程-Linux公社(www.linuxidc.com)整理.pdf”阅读,能帮助你更深入地理解Solr的实战应用。...
当前资源为Apache官方提供的solr-5.3.0-src.tgz源码,包括Lucene和solrj的源码,方便大家学习使用!此外还整理了一套有关solr-5.3.0的window和linux版包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的...
当前资源为Apache官方提供的solr-5.3.0.tgz Linux包,方便大家学习使用!此外还整理了一套有关solr-5.3.0的window和src源码包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的可以去下载!
当前资源为Apache官方提供的solr-5.3.0.zip windows包,方便大家学习使用!此外还整理了一套有关solr-5.3.0的Linux和src源码包以及官方说明文档apache-solr-ref-guide-5.3.pdf,有需要的可以去下载!
这是我整理的关于Solr的技术培训资料,它包含了关于Solr的基础知识和高级应用,例如分组、分词器、权重等问题,因为本人在学习solr时发现资源太少,所以整理了一些,当然由于本人技术不足,难免知识点不够全面,有...
旨在方便大家学习和使用Solr,Solr官方wiki对很多技术细节介绍的非常完整详细,很多是官方手册并不包含的主题,而且很多页面很难找到,在首页的链接中找不到,本文档通过对官方wiki的翻译和整理,方便技术细节和关键...
项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松copy复刻,拿到资料包后可轻松复现出一样的项目,本人...收取的费用仅用于整理和收集资料耗费时间的酬劳 3. 积分资源不提供使用问题指导/解答
本文将深入探讨标题“我整理的搜索引擎学习和开发相关资料”中涉及的知识点,并结合描述及压缩包内的文件,提供一个全面的搜索引擎技术概述。 一、搜索引擎原理 "搜索引擎原理"这一主题涵盖了搜索引擎的基本工作...
压缩包中的“Nutch.pdf”可能是Nutch的官方文档、教程或者是博主整理的学习笔记。这份PDF文档通常会详细讲解Nutch的架构、工作流程、配置方法,以及一些示例和最佳实践。学习者可以通过阅读这份文档,系统地了解...
"大数据资料,自己整理的资料.rar" 这个标题表明这是一个包含个人整理的大数据相关学习资源的压缩包。由于没有具体列出压缩包内的子文件名称,我们将基于一般大数据领域的常见知识点进行阐述。 大数据的核心概念...
一站式SpringBoot for NoSQL开发教程学习手册。 含SpringBoot2.0 +: 雷迪斯 高速缓存 MongoDB 弹性搜索 卡桑德拉 CouchBase 索尔 Neo4j 宝石火 共9种常用NoSQL数据库操作,工具类,演示代码。用于整理日常常用...
网站搜索的进化是一个涵盖多个阶段和技术领域的话题,主要包括初期搜索技术、中期的全文检索引擎以及现代搜索网站的演进。...这不仅涉及到数据处理、检索算法,还涵盖了自然语言处理、机器学习等多个IT领域的专业知识。
在“Java+Web项目实战大全源码搜索引擎源码整理”中,我们主要关注的是使用Java编程语言进行Web项目的开发,特别是构建一个搜索引擎的实践过程。这个项目可能涉及到多个关键知识点,包括但不限于以下几点: 1. **...
“各类数据采集”则暗示开发者可能具备数据抓取或爬虫技术,能够从互联网上自动收集和整理信息。这对于数据分析、市场研究或内容更新等场景非常有用。 综合以上信息,我们可以得出以下知识点: 1. ASP编程:了解...
标题中的“一些经典的项目模块合集”表明这是一个包含多个不同技术模块的集合,可能是为了学习、参考或实际项目开发而整理的资源包。描述中提到的6个部分暗示了这个合集是多元化的,涵盖了Spring Security、AMQP、...
MongoDB学习笔记.docx mybatis原理.docx MyBatis面试专题.docx MyBatis面试专题及答案.pdf Mybatis面试题(含答案).pdf MySQL性能优化的21个最佳实践.pdf mysql面试专题.docx MySQL面试题(含答案).pdf Netty面试...
例如,在上述文档中,我们需要提取出所有含有近义词的成语,并将其整理成便于处理的形式。 **技术应用**: - **Python中的字符串操作**:使用Python中的字符串方法或正则表达式来实现。 - **自然语言处理工具**:...