`
duanjiangong
  • 浏览: 62816 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
今天开发新的页面时,在firefox下发现展现没有问题后,发布到了测试服务器开始让测试人员测试,谁知人家立马找过来说样式没有,原来在IE6下是没有样式的,奇怪对IE7和其他浏览器都进行了测试,发现只有IE6下没有样式,真是头大。经过分析,怀疑是CSS的编码问题,查看CSS的编码时发现是UTF-8的,而页面的编码是GBK的,把CSS的编码进行调整后,页面显示正常。原来IE6对编码有硬性规定CSS的编码必须与页面的编码相同,否则无法加载。好在在IE7下,已经没有此类问题了。 大家在开发的时候还的多注意啊!
现在好多网站需要在搜索结果上进行分类统计,比如招聘网站需要统计出某一关键词下的满足本科的有多少岗位、满足专科的有多少岗位、满足4000-6000薪资的多少岗位等等,这就需要对搜索结果进行分类统计了。但现在一直没有发现有人在lucene上很好的实现这个功能,呵呵,可能是大牛们没有时间研究这个吧。 我在分析了Lucene的源码的基础上开发出了这个功能,因牵扯到公司机密无法透露具体代码,但可以给大家共享一下原理和思路,供大家参加,也许还有更好的方法实现。 思路:我们可以参照lucene里面的排序原理来对lucene的源码进行重构,我们都知道lucene是可以按照不同的字段进行排序的,排序用的字段从 ...
原来应用中一直没有应用中文分词器,因为一直没有理想的分词器。最近发现好多人在应用庖丁分词器。从网上下载了测试了一下,分词速度是挺不错,但在一些地方还是无法满足我的需要:比如XXX2-12 是XXX影片第二部的第二集。但发现拆词的时候把2-12是作为一个关键词出现的,这样用户在搜索12集就无法搜索出来了,还有02分为一个关键词,那搜索2的时候就无法搜索出,这些都是不符合“我们”的使用要求的,幸好庖丁在重构上是表现不错,可以通过配置文件进行改造。对数字的分词器进行了重构,解决了此问题。所以,中文分词器还得根据自己的需求进行量身定做,庖丁在这方面做的不错,向大家推荐。
现在Lucene在网站的使用已经越来越多,但发现好多开发人员都只是停留在使用层面,对性能的优化基本上没有多少考虑,我经过两年的使用,把个人经验贴出分享: 1、合理配置那些字段需要保存;那些字段需要索引。 2、搜索结果中的读取字段也要根据需要合理配置读取,不要每次都把整个Document读出来。 3、打开Lucene的NIO设置。 暂时想到这么多,再想到再补吧。
先说下好处:文本页面(htm/css/js等)启用压缩后,一般可以压缩70%左右。即50K的文件,实际只需传输15K到客户端,由客户端解压显示。 另外,实践证明,启用Gzip压缩后,不会对搜索引擎收录有影响。 在Apache1.3时代,有一个mod_gzip的模块,但Apache2.x系列已经内置了Deflate模块,因此,只需要安装Deflate模块即可。 一般默认没有装Deflate,最直接的方法就是重装Apache,在原来的配置文件后加上 --enable-deflate --enable-headers 。 如果不想重装,就单独编译,mod_deflate.c在源文件目录的module ...

Resin配置JMX

-J-Djava.rmi.server.hostname=192.168.1.122 -J-Dcom.sun.management.jmxremote -J-Dcom.sun.management.jmxremote.port=911 -J-Dcom.sun.management.jmxremote.ssl=false -J-Dcom.sun.management.jmxremote.authenticate=false
Global site tag (gtag.js) - Google Analytics