- 浏览: 11722 次
- 性别:
- 来自: 北京
最新评论
文章列表
solr同时配置三种中文分词器到schema.xml。
关键点在三种分词器的词库配置。
先下载三种不同版本的分词器
mmseg4j-1.8.5.zip;
IKAnalyzer3.2.8 bin.zip
paoding-analysis-2.0.4-beta.zip
solr版本:3.5
web服务器:tomcat6
开始配置到schema.xml
(1)mmseg4j-1.8.5.zip
关键点在dicPath
<fieldType name="随便叫" class="solr.TextField" positionIncrementGap=& ...
catalina.bat
rem ----- Execute The Requested Command ---------------------------------------
set JAVA_OPTS=-Xms512m -Xmx1024m
echo Using CATALINA_BASE: "%CATALINA_BASE%"
echo Using CATALINA_HOME: "%CATALINA_HOME%"
maxThreads="600" ///最大线程数
minSpareThre ...
Tesseract-OCR 识别中文
- 博客分类:
- open
3.2版本试了中文和英文,反正我这里不怎么样,我觉得识别率很低。
jar包和测试文件放上来,有机会谁去测测。
tesseract-ocr-3.02.eng.tar.gz,tesseract-ocr-3.02.chi_sim.tar.gz这语言包太大了,自己去下吧
lucene和solr的版本对应
- 博客分类:
- solr
在Solr1.4.x的时候,Solr和Lucene是独立发布的,Solr一般会在Lucene发布新版本后跟进发布一个新的版本。到了3.1的时候,两者代码做了合并,版本号统一了,并同时发布。
具体情况如下
Solr 1.4.0 --- Lucene 2.9.1
Solr 1.4.1 --- Lucene 2.9.3
Solr 3.1 --- Lucene 3.1
Solr 3.2 --- Lucene 3.2
最新的solr和lucene版本是4.0
TOMCAT在运行过程中可以实时监控当前应用JVM的占用情况
<rolerolename="tomcat"/> <rolerolename="role1"/> <rolerolename="manager"/> ...
alfresco安装好的目录中 有一个自带的web容器tomcat,里面同时跑了alfresco和solr两个web工程,两个工程之间互相通信
如果想分别部署,需要分别部署在两个web容器中,两个web容器可以放在不同的机器上,这样可以单独有一台搜索服务器,提高性能
下面来说说步骤 下面的web容器全部以tomcat为准
1. web容器中先部署solr工程
在web容器中,tomcat_home\Catalina\localhost 加入 solr.xml 文件,里面配置了solr搜索服务器的物理位置,通过其中的配置项,指定solr的关键配置文件所在的位置
现在是搜索服务器是205,所以 ...
java "\","/"
- 博客分类:
- java
String str="\\" ==== \
String str="//" ==== /
XML解析模型 DOM和SAX
- 博客分类:
- XML解析
(转百度文库)
DOM先将XML文档映射成一颗树,然后通过采用一系列与树相关的操作去处理这份文档。这种方法有很多的好处,首先开发者很容易理解,使用一颗树这对于开发者来说是最常见不过的了。DOM最常用于XML在Service中需要频繁修改的场合。当然DOM也有它的缺点,在处理XML文档的时候,它需要载入整个文档,而不管你需要修改的是否只是其中的一小部分。因此它的运行效率以及对内存的使用显然是不能接受的,尤其是面对很大的XML文档。
SAX使用事件驱动的模型来处理XML文档。通过一系列事件的触发,来完成对XML的解析,你可以只关心你所要处理的事件,当这些事件发生时,会调用 ...
System.exit(0);关闭java虚拟机
System.exit(0)是正常退出程序,而System.exit(1)或者说非0表示非正常退出程序
System.exit(status)不管status为何值都会退出程序