- 浏览: 44577 次
最新评论
文章列表
经过paoding分词后,再对每个token进行2次分词,此处是二元切分法
public class MyCJKFilter extends TokenFilter {
private TermAttribute termAtt = (TermAttribute) addAttribute(TermAttribute.class);;
private OffsetAttribute offsetAtt = (OffsetAttribute) addAttribute(OffsetAttribute.class);
private PositionIncrem ...
关于paoding动态加载词典,网上多数是如下代码,但是我下载了2.0.4的源码后,发现Paoding.java 这个文件时空的,不存在这个方法
Paoding paoding = PaodingMaker.make();
paoding.stopAutoDetecting();//关闭自动词典监测,使用手动检测
用
paoding.dic.detector.interval
=60参数,可以通过配置文件(paoding-analysis.properties)来制定多少秒动态加载词典,如果设置为0或负数,则不会自动重载词典(autoDetect)
在添加 ...
Java正则表达式入门
- 博客分类:
- 正则
众所周知,在程序开发中,难免会遇到需要匹配、查找、替换、判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力。因此,学习及使用正则表达式,便成了解决这一矛盾的主要手段。
大
家都知道,正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它
用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
自从jdk1.4推出java.util.regex包,就为我们提供了很好的JAVA正则表达式应用平台。
...
今天发现了一个以前没有注意的问题,solr的schema.xml配置文件中,unique-key的field必须是string类型,否则会报错。
org.apache.solr.common.SolrException: QueryElevationComponent requires the schema to have a uniqueKeyField implemented using StrField
解决办法,删除solrconfig.xml配置文件中的Elevation组件的配置
<searchComponent name="ele ...
memcached的key的限制
- 博客分类:
- xmemcached
用xmemcached客户端,对于key的内容有限制,不能包含如下字符:
描述 | ascii码值
空格 --> 32
\r --> 10
\n --> 13
还有一个是方块,无法复制 --> 0
正则替换字符串的全角、半角标点符号
- 博客分类:
- Java
class
T {
public
static
void
main(String[] args) {
String str =
"!!!!去符号标号!!当然。!!..**半角"
;
System.out.println(str);
System.out.println(str.replaceAll(
"\\p{Punct}"
,
""
));\\替换半角
System.out.print ...
MyEclipse8.6安装svn插件
- 博客分类:
- myeclipse
安装subclipse, SVN 插件
1、从官网下载site-1.6.16.zip文件,网址是:subclipse.tigris.org,
2、从中解压出features与plugins文件夹,复制到C:\MyEclipse\myPlugin\svn里面,其它的*.xml文件不要。
3、在C:\MyEclipse\MyEclipse8.6\dropins下新建文件svn.link,内容是:path=C:\\MyEclipse\\myPlugin\\svn 保存。
4、删除C:\MyEclipse\MyEclipse8.6\configuration\org.eclips e. ...
logback日志样例
- 博客分类:
- logback
<?xml version="1.0" encoding="UTF-8"?>
<configuration>
<jmxConfigurator />
<appender name="stdout" class="ch.qos.logback.core.ConsoleAppender">
<layout class="ch.qos.logback.classic.PatternLayout">
< ...
昨天收到一个xmc的issue报告,大概的意思是将Xmemcached
与spring 2.5集成没有任何问题,但是将spring升级到3.0就会抛出一个异常,并且spring容器无法正常启动,异常信息类似“Couldn
't find a destroy method named '
shutdown' on bean XMemcachedClientFactoryBean”。更详细的情况可以看这里
,这是这位朋友分析的结果,简单来说就是spring 3.0对于查找destroy method为空的情况处理不同了,过去是打个日志,现在是抛出一个异常。
问题说完,这里主要是介绍 ...
solrj+spellcheck
- 博客分类:
- solr
package com.doculibre.constellio.servlets;
import java.net.MalformedURLException;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServer;
import org ...
1.
下载
paoding-analysis-2.0.4-beta.zip
http://code.google.com/p/paoding/downloads/list
2.
解压压缩包至
paoding-analysis-2.0.4-beta
3.
设置
paoding
的
home
环境变量:
l
把
paoding-analysis-2.0.4-beta
中的
dic
...
solr 使用自定义的 QueryParser
- 博客分类:
- solr
如果想让 solr 有更加强大的功能或在查询时做一些特别的处理。可以在 solrconfig.xml 里注册自定义的 QueryParser(查询解析器),这是 solr 1.3 的新功能(插件功能),如:
<
queryParser
name
=
"mylucene"
class
=
"or ...
如果向您的服务器发出了某项请求要求显示您网站上的某个网页(例如,当用户通过浏览器访问您的网页或在 Googlebot 抓取该网页时),那么,您的服务器会返回 HTTP 状态代码以响应该请求。
此状态代码提供了有关请求状态的 ...