- 浏览: 34395 次
- 性别:
- 来自: 北京
最新评论
-
swjtu_Icetea:
import java.io.StringReader;imp ...
Lucene中文分析器的中文分词准确性和性能比较 -
luckaway:
PaodingAnalyzer把停顿词直接废弃掉,个人觉的不太 ...
Lucene中文分析器的中文分词准确性和性能比较 -
linliangyi2007:
IKAnalyzer已经推出3.0版本了,欢迎使用http:/ ...
Lucene中文分析器的中文分词准确性和性能比较 -
approximation:
stta04 写道怎么没有JE分词来做测试,JE分词与paod ...
Lucene中文分析器的中文分词准确性和性能比较 -
stta04:
怎么没有JE分词来做测试,JE分词与paoding分词哪个好? ...
Lucene中文分析器的中文分词准确性和性能比较
文章列表
获取源代码svn co http://svn.igniterealtime.org/svn/repos/openfire/trunk openfire。当前版本3.6.4eclipse选择new java project\create project from existing source\下载源文件的本地根路径eclipse选择window\show view\antant view选择new buildfile\下载源文件的本地根路径\build\build.xmlant view\ant openfireeclipse选择src\java\org.jivesoftware.openfir ...
class "junit.framework.JUnit4TestCaseFacade"'s signer information does not match signer information of other classes in the same package
这个问题应该是多个libraries中包含junit的原因。
解决方法是在java build path的order and export中把junit调整到比较靠前位置。
- 2009-06-04 16:35
- 浏览 3833
- 评论(0)
在eclipse中设置heritrix2的运行环境
- 2009-03-19 14:03
- 浏览 1987
- 评论(0)
Heritrix2在Settings Sheets时出现java.lang.NullPointerException错的原因和解决方式
如果使用IE或者IE内核的浏览器,在进行Settings Sheets操作时,会出现上述错误。这是因为Heritrix2在相关页面使用<button> 控件替换了原来的<input type="button">。<button> 控件 与 <input type="button"> 相比,提供了更为强大的功能和更丰富的内容。但遗憾的是,微软对于这个控件的实现 ...
- 2009-03-16 11:14
- 浏览 1913
- 评论(0)
在eclipse中配置lucene2的运行环境
如果只是一般性的lucene开发,我觉得没有必要配这个环境。
下载lucene源码,现在是2.4.0。解压在C:\lucene-2.4.0。
eclipse新建java project,在contents选择中选择create project from existing source,选择lucene路径(C:\lucene-2.4.0)。在project name中写lucene-2.4.0。完成
在project的build path加入junit。
完成上述三步,环境基本上就建完了。但在contrib中还会有错误 ...
- 2009-03-10 14:18
- 浏览 3894
- 评论(0)
Lucene中文分析器的中文分词准确性和性能比较
作者:approximation
对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。单纯的中文分词的实现一般为按字索引或者按词索引。按字索引顾名思义,就是按单个字建立索引。按词索引就是按词喽,根据词库中的词,将文字进行切分。车东的交叉双字分割或者叫二元分词我觉得应该算是按字索引的改进,应该还是属于字索引的范畴吧。 ...
- 2009-03-09 15:37
- 浏览 18480
- 评论(5)