- 浏览: 80306 次
- 性别:
- 来自: 济南
最新评论
-
vern:
受益了,谢谢
not in 失效 -
todayapple:
你的折线图能出来吗。。。
jfreechart例子 -
reachingstar:
Good, 但还是没能弄太明白!
JBoss启动过程 -
liheqian_0083:
HOHO,收监
lucene中文分词
文章列表
地址:http://www.lucene.com
简介:Ramblings about Lucene, Nutch, and other stuff.
摘要:
I'm a primary developer of the Lucene and Nutch open source search projects.
Lot's of folks think good ...
- 2007-11-09 10:37
- 浏览 1013
- 评论(0)
1 、问题的来源
增加分词以后结果的准确度提高了,但是用户反映返回结果的速度很慢。原因是, Lucene 做每一篇文档的相关关键词的高亮显示时,在运行时执行了很多遍的分词操作。这样降低了性能。
2 、解决方法
在 Lucene1.4.3 版本中的一个新功能可以解决这个问题。 Term Vector 现在支持保存 Token.getPositionIncrement() 和 Token.startOffset() 以及 Token.endOffset() 信息。利用 Lucene 中新增加的 Token 信息的保存结果以后,就不需要为了高亮显示而在运行时解析每篇文档。通过 Field 方法 ...
- 2007-11-09 10:35
- 浏览 1104
- 评论(1)
文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。
Lucene 简介
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完 ...
- 2007-11-09 10:34
- 浏览 1368
- 评论(0)
Lucene-2.0学习文档
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索和操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。
值得一提的是:2006年6月1号Lucene2.0发布,它与以前广泛应用和介绍的Lucene 1.4.3并不兼容。有了很大的改进和优化,这里只介绍的是Lucene 2.0。
Lucene2.0的下载地址是http://apache.justdn.org/ ...
- 2007-11-09 10:33
- 浏览 1347
- 评论(0)
首先肯定是建立索引了啊
public void creatIndex() {
File indexDir = new File(getPathIndex());
try {
List<article></article> listArticle = getArticleDao().search(null, null,null, null, null, null, null, null, new Boolean(true));
for (int i = 0; i < listArticle.size(); i++) {
Document doc = new ...
- 2007-11-09 10:29
- 浏览 1115
- 评论(0)
搜索
Lucene搜索的api的类主要有4个 IndexSearcher ,Query(包括子类),QueryParser,Hits
IndexSearcher是搜索的入口,他的search方法提供了搜索功能
Query有很多子类, 各种不同的子类代表了不同的查询条件,下文详述
QueryParser是一个非常通用的帮助类,他的作用是把用户输入的文本转换为内置的Query对象(大多数web搜索引擎都提供一个查询输入框来让用户输入查询条件)。QueryParser内置提供了很多语法来使使用可以输入各种高级条件的Query。比如: "Hello AND world"会被解析为一 ...
- 2007-11-09 10:25
- 浏览 1046
- 评论(0)
Boosting特性
luncene对Document和Field提供了一个可以设置的Boosting参数, 这个参数的用处是告诉lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优先考虑
lucene默认的boosting参数是1.0, 如果你觉得这个field重要,你可以把boosting设置为1.5, 1.2....等, 对Document设置boosting相当设定了它的每 ...
- 2007-11-09 10:24
- 浏览 973
- 评论(0)
Doug Cutting 于2000年开始的项目 2001年9月后加入apache, Lucene是Doug Cutting的middle name 。 目前Lucene已经是apache的top level的项目, 已经不在jakarta下面, 同时也有了python,perl,c++,.net, Ruby(进行中)多个版本
Lucene 主要的两个任务:indexing and searching
Indexing主要使用的类 IndexWriter 较核心的类,index文件由它创建
Directory 一个抽象的标示index文件地址的类,有两个实现:FSDirectory和RAM ...
- 2007-11-09 10:22
- 浏览 765
- 评论(0)
1、"abc"与new String("abc");
经常会问到的面试题:String s = new String("abc");创建了几个String Object?【如这里创建了多少对象? 和一道小小的面试题 】
这个问题比较简单,涉及的知识点包括:
引用变量与对象的区别;
字符串文字"abc"是一个String对象;
文字池[pool of literal strings]和堆[heap]中的字符串对象。
一、引用变量与对象:除了一些早期的Java书籍和现在的垃圾书籍,人们都可 ...
- 2007-11-07 10:25
- 浏览 1835
- 评论(0)
锁是网络数据库中的一个非常重要的概念,它主要用于多用户环境下保证数据库完整性和一致性。各种大型数据库所采用的锁的基本理论是一致的,但在具体实现上各有差别。目前,大多数数据库管理系统都或多或少具有 ...
- 2007-09-20 08:57
- 浏览 1173
- 评论(0)
好久没有更新了,今天更新一篇在网上搜到的文章
引自:http://chinabeta.cn/wgjs/wl/JSP/200708/19245.html
内部类是指在一个外部类的内部再定义一个类。内部类作为外部类的一个成员,并且依附于外部类而存在的。内部类可为静态,可用protected和private修饰(而外部类只能使用public和缺省的包访问权限)。内部类主要有以下几类:成员内部类、局部内部类、静态内部类、匿名内部类
为什么需要内部类?
典型的情况是,内部类继承自某个类或实现某个接口,内部类的代码操作创建其的外围类的对象。所以你可以认为内部类提供了某种进入其外围类的窗口。使用内 ...
- 2007-09-15 17:34
- 浏览 690
- 评论(0)
这个问题一直没弄明白,今天终于调出来了,其实调一下安全就可以了,如下: 依次打开 控制面板--管理工具--本地安全策略--本地策略--安全选项 在里面找到一个叫:本地帐户的共享和安全模式的选项,把它改成经典-本地用户以自己的身份验证 就可以了
- 2007-09-13 08:08
- 浏览 1070
- 评论(0)
此问题出现在数据库的移值上。移值后,数据库的登陆名和数据库用户名孤立,原数据中,用建立的用户名密码登陆可以访问数据库,但是移值后就不能访问了。而且如果您尝试向该登录帐户授予数据库访问权限,则会因该用户已经存在而出现以下错误信息: ‘该登录已经在另一个用户名下拥有帐户’。 产生错误的原因是: 在您向目标服务器传输登录帐户和密码后,您的用户可能还无法访问数据库。登录帐户与用户是靠安全识别符 (SID) 关联在一起的;在您移动数据库后,如果 SID 不一致,SQL Server 可能会拒绝用户访问数据库。此问题称为孤立用户。如果您使用 ...
- 2007-07-31 14:49
- 浏览 1249
- 评论(0)
1、使用JdbcTemplate的execute()方法执行SQL语句
代码
jdbcTemplate.execute("CREATE TABLE USER (user_id integer, name varchar(100))");
...
- 2007-06-26 14:34
- 浏览 742
- 评论(0)