- 浏览: 4179 次
- 性别:
- 来自: 北京
最新评论
文章列表
开发了一个百度网盘热门资源站,因为用了spring mvc的resturl和有静态化需要,即把url生成对应的物理文件。所以想到用base64对用户的搜索关键词进行转码。但是因为原base64中,有字符“/”影响resturl的解析,所以对base64进行了稍加改造,去掉了“/”,改为“!”
js端转码代码:
function searchJump(key){
key = base64encode(utf16to8(key));
window.location.href = "/search/" + key+".html";
}
v ...
在阿里云上弄了个最小的云服务器,512m内存,建了个百度网盘资源站省淘网,tomcat有时会因内存占用过多,被系统回收,暂时没有太好的解决方法,就写了个小程序,监控tomcat线程,如果线程没了,就自动启动,代码如下:
package monitor;
import java.io.ByteArrayOutputStream;
import org.apache.commons.exec.CommandLine;
import org.apache.commons.exec.DefaultExecutor;
import org.apache.commons.exec.PumpS ...
今天观察我的网站省淘网时,发现好多相关搜索结果,都是关键词“的”的命中。
一开始想自己把字符串里的“的”replace掉得了,但是一想,jcseg应该有这个功能吧。
翻阅了说明文档后,最终发现,默认的配置文件没有开启自动过滤停止词(其实就是去掉不想要的分词)
具体设置:
默认的配置文件在jcseg-core-1.9.1.jar包里:jcseg.properties
#是否自动过滤停止词(0 关闭, 1 开启)
jcseg.clearstopword=1
这个配置默认是0,改成1,重启后就开始了。
具体的停止词,在词库文件:lib/lexicon/lex-stopword.lex
自己 ...