本月博客排行
-
第1名
龙儿筝 -
第2名
zysnba -
第3名
johnsmith9th - wy_19921005
- sgqt
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- wy_19921005
- benladeng5225
- fantaxy025025
- javashop
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- ranbuijj
- arpenker
- tanling8334
- kaizi1992
- sichunli_030
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- jh108020
- zxq_2017
- jbosscn
- lemonhandsome
- luxurioust
- Xeden
- lzyfn123
- forestqqqq
- zhanjia
- nychen2000
- ajinn
- wjianwei666
- johnsmith9th
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
互联网专栏最新文章
lucene-MultiPharseQuery带前缀和后缀查询
1、根据add方法顺序不同,从前到后依次是前缀,后缀,后缀后跟的单字。
2、
MultiPharseQuery query=new MultiPharseQuery();
Term t1=new Term("bookname","钢");
Term t2=new Term("bookname","和");
qu ...
lucene-SpanQuery精解和与正则RegexQuery精解
1、SpanTermQuery:与TermQuery一样。
Term t=new Term("contenct","david");
SpanTermQuery query=new SpanTermQuery(t);
2、SpanFirstQuery:从first的内容起始位置开始,在一个固定的宽度内查找所指定的词条。
Term t=new Term( ...
lucene-QueryParser
1、QueryParser在lucene2.0中所有操作建立在QueryParser实例的基础上
2、
String field="bookname";
String queryStr="java struts";
QueryParser parser=new QueryParser(field,new
standardAnalyzer());
...
lucene-检索结果的翻页问题
使用缓存+多次查询+数据库
1、在用户第一次查询后,将结果放在session。这里所说的结果指的是除了当前页外,另外再缓存一部分结果,比如后5页的结果。
2、这样,当用户翻页时,会先从session缓存中查看当前页是否被缓存。
3、如果是,则取出,直接返回给用户,如果不是,则进行索引的检索, 取出当前页内容返回,并更新缓存。
4、在缓存和多次查询的基础上,用数据库来缓解一部分访问压力,在用户 ...
lucene-多Field搜索与多索引搜索
1、多域搜索
MultiFieldQueryParser提供了3个静态方法
1)在不同的Field进行不同的查找
public static Query parse(String[] queries,String[] fields,Analyzer analyzer) throws ParseE ...
lucene-处理中文PDF的xpdf
简单处理中文的方式是xpdf
http://www.foolabs.com/xpdf/home.html
2、
Xpdf is an open source viewer for Portable Document Format (PDF) files. (These are also sometimes also called 'Acrobat' files, from the nam ...
lucene-JE中文分词
1、比较好的JAVA写的JE分词http://jesoft.cn:9080/je-analysis-1.5.3.jar,官网http://www.jesoft.cn/
2、提供相关的API
//采用正向最大匹配的中文分词算法,相当于分词粒度等于0MMAnalyzer analyzer = new MMAnalyzer();//参数为分词粒度:当字数等于或超过该参数,且能成词,该词就被切分出来MM ...
nutch1.0在eclipse下的成功编译要注意事项
有以下要点要注意:
1、在WINDOWS的环境变量中要正确指定JDK目录
2、build.xml编译报错,
Nutch\nutch-0.9\build.xml:61: Specify at least one source--a file or resource collection.
将下面几行的前几行(从61行开始直到下面的<copy todir="${conf.dir} ...
为Nutch 1.0添加JE中文分词
先下载Nutch 1.0的源文件:
svn co http://svn.apache.org/repos/asf/lucene/nutch/tags/release-1.0 ./nutch-1.0
更改查询语法解析部分:
改变tokenize的方式(原来为中文单字识别)
modify “src/java/org/apache/nutch/analysis/NutchAnalysis.jj”l ...
ubuntu下nutch-1.0的安装和配置错误排除
一、安装JDK(笔者推荐使用原生的方式安装SUN-JDK6
一、保证TOMCAT的正常安装
二,下载nutch-1.0,解压后,并将它拷贝到/opt/目录下。cd /opt/nutch-1.0root@fjadmin-webcrawler:/opt/nutch-1.0# sh bin/nutch crawl一般来说没有设置JAVA_HOME等环境,会报以下错误:[: 72: ==: unex ...
nutch-JE分词
先下载Nutch 1.0的源文件:
co http://svn.apache.org/repos/asf/lucene/nutch/tags/release-1.0 ./nutch-1.0
更改查询语法解析部分:
改变tokenize的方式(原来为中文单字识 ...
lucene入门-复杂索引建立
一个document包括多个field,以一个document为了一个单元建立索引,下例包括2个document:
package bindex;import java.io.IOException;
import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apac ...
lucene入门-索引网页
package bindex;import java.io.File;import tool.FileText;import java.io.IOException;
import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index ...
lucene入门-索引目录下的所有网页以及索引检索
package bindex;import java.io.File;import tool.FileText;import tool.FileList;import java.io.*;
import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.l ...
lucene-使用CJKTokenizer分词
二分法分词
package busetoken;
import org.apache.lucene.analysis.cjk.CJKTokenizer;import org.apache.lucene.analysis.Token;
import java.io.IOException;import java.io.StringReader;
public class UseCjk {
/ ...
lucene-使用自带中文分词器
使用lucene内自带的,在contrib/analyzerslucene-analyzers-2.9.0.jar
即单字分析
package busetoken;
import java.io.IOException;import java.io.StringReader;
import org.apache.lucene.analysis.Token;import org.apache. ...
互联网热门文章
博客专栏评论
分享一款代码生成器,拖拽式组件结合流式处理,很容易的访问数据库、http、文件读写操作等等,支持编写j ...
MCLoginandPwd 评论了 spring-data-jpa原理探秘(4)-JpaQueryE ...
MCLoginandPwd 评论了 spring-data-jpa原理探秘(4)-JpaQueryE ...