`
文章列表
经过paoding分词后,再对每个token进行2次分词,此处是二元切分法   public class MyCJKFilter extends TokenFilter {     private TermAttribute termAtt = (TermAttribute) addAttribute(TermAttribute.class);;     private OffsetAttribute offsetAtt = (OffsetAttribute) addAttribute(OffsetAttribute.class);     private PositionIncrem ...
关于paoding动态加载词典,网上多数是如下代码,但是我下载了2.0.4的源码后,发现Paoding.java 这个文件时空的,不存在这个方法 Paoding paoding = PaodingMaker.make(); paoding.stopAutoDetecting();//关闭自动词典监测,使用手动检测   用 paoding.dic.detector.interval =60参数,可以通过配置文件(paoding-analysis.properties)来制定多少秒动态加载词典,如果设置为0或负数,则不会自动重载词典(autoDetect)   在添加 ...
众所周知,在程序开发中,难免会遇到需要匹配、查找、替换、判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力。因此,学习及使用正则表达式,便成了解决这一矛盾的主要手段。  大 家都知道,正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。   自从jdk1.4推出java.util.regex包,就为我们提供了很好的JAVA正则表达式应用平台。 ...
今天发现了一个以前没有注意的问题,solr的schema.xml配置文件中,unique-key的field必须是string类型,否则会报错。 org.apache.solr.common.SolrException: QueryElevationComponent requires the schema to have a uniqueKeyField implemented using StrField   解决办法,删除solrconfig.xml配置文件中的Elevation组件的配置 <searchComponent name="ele ...
用xmemcached客户端,对于key的内容有限制,不能包含如下字符:   描述  |  ascii码值   空格 --> 32 \r --> 10 \n --> 13  还有一个是方块,无法复制  --> 0
http://www.unicode.org/reports/tr18/
class  T {    public   static   void  main(String[] args) {     String str =  "!!!!去符号标号!!当然。!!..**半角" ;     System.out.println(str);     System.out.println(str.replaceAll( "\\p{Punct}" ,  "" ));\\替换半角     System.out.print ...
安装subclipse, SVN 插件 1、从官网下载site-1.6.16.zip文件,网址是:subclipse.tigris.org, 2、从中解压出features与plugins文件夹,复制到C:\MyEclipse\myPlugin\svn里面,其它的*.xml文件不要。 3、在C:\MyEclipse\MyEclipse8.6\dropins下新建文件svn.link,内容是:path=C:\\MyEclipse\\myPlugin\\svn 保存。 4、删除C:\MyEclipse\MyEclipse8.6\configuration\org.eclips e. ...

logback日志样例

<?xml version="1.0" encoding="UTF-8"?>  <configuration>  <jmxConfigurator />  <appender name="stdout" class="ch.qos.logback.core.ConsoleAppender">  <layout class="ch.qos.logback.classic.PatternLayout">  < ...
昨天收到一个xmc的issue报告,大概的意思是将Xmemcached 与spring 2.5集成没有任何问题,但是将spring升级到3.0就会抛出一个异常,并且spring容器无法正常启动,异常信息类似“Couldn 't find a destroy method named ' shutdown' on bean XMemcachedClientFactoryBean”。更详细的情况可以看这里 ,这是这位朋友分析的结果,简单来说就是spring 3.0对于查找destroy method为空的情况处理不同了,过去是打个日志,现在是抛出一个异常。    问题说完,这里主要是介绍 ...

solrj+spellcheck

    博客分类:
  • solr
package com.doculibre.constellio.servlets; import java.net.MalformedURLException; import java.util.Iterator; import java.util.List; import java.util.Map; import java.util.Map.Entry; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.SolrServer; import org ...

solr整合paoding

1.         下载 paoding-analysis-2.0.4-beta.zip http://code.google.com/p/paoding/downloads/list   2.         解压压缩包至 paoding-analysis-2.0.4-beta 3.         设置 paoding 的 home 环境变量: l         把 paoding-analysis-2.0.4-beta 中的 dic ...
Solr 使用自定义 Query Parser
如果想让 solr 有更加强大的功能或在查询时做一些特别的处理。可以在 solrconfig.xml 里注册自定义的 QueryParser(查询解析器),这是 solr 1.3 的新功能(插件功能),如: < queryParser   name = "mylucene"   class = "or ...
如果向您的服务器发出了某项请求要求显示您网站上的某个网页(例如,当用户通过浏览器访问您的网页或在 Googlebot 抓取该网页时),那么,您的服务器会返回 HTTP 状态代码以响应该请求。 此状态代码提供了有关请求状态的 ...
Global site tag (gtag.js) - Google Analytics