`
weitao1026
  • 浏览: 1048221 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
文章列表
1.      CAS 简介 1.1.  What is CAS ? CAS ( Central Authentication Service ) 是 Yale 大学发起的一个企业级的、开源的项目,旨在为 Web 应用系统提供一种可靠的单点登录解决方法(属于 Web SSO )。 CAS 开始于 2001 年, 并在 2004 年 12 ...
lucene是一款很优秀的全文检索的开源库,目前最新的版本是lucene4.4,关于lucene的历史背景以及发展状况,在这里笔者就不多介绍了,如果你真心想学习lucene,想必在这之前你已经对此作过一些了解。 有很多人知道lucene或者solr,但是却有很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改和调试。luke是google公司最早提供的,对于lucene的直接索引查看很方便,在这之前,如果你想查看下你生成的lucene的索引的全部内容,你得需要写 ...
lucene在4.x之前,没有实现分组的功能,如果业务中有需要分组的功能,那么必须的借助第三方的提供的插件,来实现分组,例如Bobo-browse,或者,自己用lucene写分组功能,笔者个人觉得用第三方的分组插件,虽说功能强大,但是比较繁琐,自己写的话,可以实现,但是效率方面却不是很好,在4.x之后,lucene已经自己实现分组功能提供了分组jar包 Java代码 复制代码 收藏代码 1.lucene-grouping-4.2.0.jar  ,利用此类可以效率很高完成分组去重功能。下面不在啰嗦,直接贴出代码,如有问题,欢迎指正! Java代码 复制代码 收藏代码 1.public ...
solr 4.2的入门配置 第一步,从官网上下载下 http://lucene.apache.org/solr/solr  4.2的压缩包 第二步,假如D:/tomcat      D盘下有tomcat 第三步, 从下载的solr包下面的dist目录下solr.war包,拷贝到D:\tomcat6\apache-tomcat-6.0.36.0\webapps下面 第四步, 从下载的solr包下面的example\solr\下面的所有东西拷贝到webapps\下面的solr\的下面 里面第一次不会有solr包,当启动tomcat时,它会把solr.war给解压出来 第五步, 找到D:\ ...
这两天发现部署到tomcat中的quartz定时任务每回都被执行了两次,但是在myeclipse执行时又不会,后来搜了网上,才发现该问题只发生于部署在tomcat服务器上,由tomcat的自启动导致。 导致该问题的原因是你的tomcat的conf目录中的server.xml有如下配置   <Host name="localhost"  appBase="webapps" unpackWARs="true" autoDeploy="true" xmlValidation="false" ...
public class test{  public static void main(String[] args){    Integer x = 400;    Integer y = x;    x++;    System.out.println(x == y);  }} 严谨的来说..==是比较的内存地址.当你创建两个变量对象并且赋值的时候.系统会为你在内存中开辟两块内存空间.他们的地址是不一样的..==就是比地址.当你new时.只要对象值不是null那么他们永远都是false..要比较值的使用. 可用用Object下的.equals(Object obj)方法进行值的比较. === ...
我们先来回顾下,一个基本的搜索流程是怎么完成的 1,得到一个索引目录Directory(可能基于内存的或者磁盘的)。 2,得到一个DirectoryReader。 3,实例化查询组件IndexSearcher。 4,检索得到TopDoc查询结果集 5,遍历ScoresDocs处理结果 我们看下这个检索的流程,大概可以分这5步,前1,2,3算是准备工作,后面的2步是我们经常需要进行数据处理的地方,那么我们Collector到底工作在哪一步呢?,其实Collector真正的起作用是在3-4步之间的。 那么Collector的作用是干什么的?为什么需要使用Collector? ...
高亮功能一直都是全文检索的一项非常优秀的模块,在一个标准的搜索引擎中,高亮的返回命中结果,几乎是必不可少的一项需求,因为通过高亮,我们可以在我们的搜索界面上快速标记出用户的检索关键词,从而减少了用户自己寻找想要的结果,在一定程度上大大提高了用户的体验性和友好度。 那么,散仙今天就来看下我们在Lucene中,怎么实现高亮,以及高亮的几种实现方式。 首先散仙还是喜欢老生常谈的来补充下高亮需要的熟悉的基本知识,当然如果你只是需要实现效果,而不关注它的底层API,那么可以忽略此部分,不过散仙还是要友好的提示一下,如果使用过程中出了点小问题,不会API,可是不容易解决的,除非你愿意各种google。 ...
关于lucene中另外一种丰富的查询方式----正则查询,lucene内置了许多的查询API,以及更强大的自定义查询方式的QueryParse,大部分情况下我们使用内置的查询API,基本上就可以满足我们的需求了,但是如果你想更灵活的定制自己的查询或者改写自己的查询API那么你完全可以继承QueryParse类来完成这项工作。 从某种方式上来说,正则查询(RegexpQuery)跟通配符查询(WildcardQuery)的功能很相似,因为他们都可以完成一样的工作,但是不同的是正则查询支持更灵活定制细化查询,这一点与通配符的泛化是不一样的,而且正则查询天生支持使用强大的正则表达式的来准确匹配 ...
Lucene4.x之后的所有索引格式如下所示: 文件名 后缀 描述 Segments File segments.gen, segments_N 存储段文件的提交点信息 Lock File write.lock 文件锁,保证任何时刻只有一个线程可以写入索引 Segment Info .si 存储每个段文件的元数据信息 Compound File .cfs, .cfe 复合索引的文件,在系统上虚拟的一个文件,用于频繁的文件句柄 Fields .fnm 存储域文件的信息 Field Index .fdx 存储域数据的指针 Field Data .fdt 存储所有文档的字段信息 T ...
Lucene的索引体系是一个写独占,读共享的结构,这意味着,我们在使用多线程进行添加索引时,性能并不会得到明显的提升,所以任何时刻只能有一个线程对索引进行写入操作,而保障这个操作的安全性则是来自于,Lucene独特的 ...
static表示“全局”或者“静态”的意思,用来修饰成员变量和成员方法,也可以形成静态static代码块,但是Java语言中没有全局变量的概念。   被static修饰的成员变量和成员方法独立于该类的任何对象。也就是说,它不依赖类 ...
用法一:常量 在JDK1.5 之前,我们定义常量都是: public static fianl.... 。现在好了,有了枚举,可以把相关的常量分组到一个枚举类型里,而且枚举提供了比常量更多的方法。 public enum Color {    RED, GREEN, BLANK, YELLOW  } 用法二:switch JDK1.6之前的switch语句只支持int,char,enum类型,使用枚举,能让我们的代码可读性更强。 复制代码 enum Signal {         GREEN, YELLOW, RED     }     public class Tr ...
由于 Tomcat 基于 Java,实际上在各种 Linux 发行版里的配置方法都大同小异,只是我看见在 Arch Linux 环境里搭建 Tomcat 的文章比较少,所以在 Arch Linux 实践一遍然后得出此文。此文假设你对 Tomcat 并不十分了解,主要笔墨将会在 Tomcat 的配置之上。 1、安装 Java JDK 在 Arch Linux 的 extra 源里有 jdk7-openjdk 和 openjdk6,可以直接使用 pacman 安装,至于选用哪一个可以视具体情况而定。我安装的是 OpenJDK 7: $ sudo pacman -S jdk7-openjdk ...
ContextLoaderListener的作用就是启动Web容器时,自动装配ApplicationContext的配置信息。因为它实现了ServletContextListener这个接口,在web.xml配置这个监听器,启动容器时,就会默认执行它实现的方法。至于ApplicationContext.xml这个配置文件部 ...
Global site tag (gtag.js) - Google Analytics