- 浏览: 53193 次
- 性别:
- 来自: 广州
最新评论
-
recole:
我也有写一个生成基本sql操作的工具,当然我的是.net版的 ...
让程序帮我们生成常用的增删改查语句 -
javac_xinyun:
统一1楼的观点,其实没有必要写成两个类的~~~个人观点而已!
利用poi进行excel 数据的导入,已修正代码繁琐问题 -
haosam:
我前几天也做了一个用poi进行数据导入的东西,不过那那个是针对 ...
利用poi进行excel 数据的导入,已修正代码繁琐问题 -
yuanliyin:
但是如何上传啊
JBOSS5.1下配置虚拟目录 -
yuanliyin:
很好使!!
JBOSS5.1下配置虚拟目录
文章列表
2008-11-28 19:09
文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关,得分越高。分值计算公式如下:
score(q,d) = coord(q,d) · queryNorm(q) · ∑ ( tf(t in d) · idf(t)2 · t.getBoost() · norm(t,d) ) t in q 其中
tf(t in d)
这个值 ...
主要收集英文技术站
InfoQ中英文站 www.TheServerSide.com www.JavaWorld.com javaworld.com
www.onjava.com today.java.net(article区) DDJ(Java和Architect区)
IBM开发者社区中英文
原文地址
Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器。本文章详细的介绍了Lucene的查询语法。通过Java语法分析器把一个查询字符串解析成 Lucene的查询器。在你选择使用Query Parser前,请考虑以下事项:如果你打算在程序中拼接查询语法串然后再利用Query Parser转换,那么强烈建议你利用相应的API来自己构造查询器。也就是说,Query Parser是为手工输入高级查询设计的,而不是为程序拼接语法串而设计的。不分词的字段也最好通过相应的API添加到查询器中,而不是通过 ...
原文地址
这篇文章主要介绍了如何提高Lucene的索引速度。介绍的大部分思路都是很容易尝试的,当然另外一部分可能会加大你程序的复杂度。所以请确认索引速度确实很慢,而且很慢的原因确实是因为Lucene自身而造成的。推荐姐妹篇:如何提高和优化Lucene搜索速度
• 确认你在使用最新的Lucene版本。
• 尽量使用本地文件系统
远程文件系统一般来说都会降低索引速度。如果索引必须分布在远程服务器,请尝试先在本地生成索引,然后分发到远程服务器上。
• 使用更快的硬件设备,特别是更快的IO设备
• 在索引期间复用单一的IndexWriter实例
原文地址
确认你在使用Lucene的最新版本
尽量使用本地文件系统
远程文件系统一般来说都会降低搜索速度。如果索引必须分布在远程服务器,可以尝试将远程文件系统设置为只读。在某些情况下,这样可以提高性能。
使用更快的硬件设备,特别是更快的IO设备
Lucene搜索可以很好的工作在基于闪存的固态硬盘上。固态硬盘的寻道时间大概比传统的以磁盘为基础的硬盘快100倍。这意味着,配备固态硬盘的机器用于文件缓存的内存将变少,搜索需要较少的热身时间,能够更加迅速作出反应。
加大你的机器内存容量,给Java虚拟机分配更多的内存
索引越大,在搜索时需要
Here are some things to try to speed up the indexing speed of your Lucene application. Please see ImproveSearchingSpeed for how to speed up searching.
http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
Be sure you really need to speed things up. Many of the ideas here are simple to try ...
The ftp4j library implements a Java full-features FTP client. With ftp4j embedded in your application you can: transfer files (upload and download), browse the remote FTP site (directory listing included), create, delete, rename and move remote directories and files.
ftp4j类库可支持实现java版的FTP客户端,可 ...
又拍网是一个照片分享社区,从2005年6月至今积累了260万用户,1.1亿张照片,目前的日访问量为200多万。5年的发展历程里经历过许多起伏,也积累了一些经验,在这篇文章里,我要介绍一些我们在技术上的积累。
又 ...