- 浏览: 2917 次
- 性别:
- 来自: 武汉
最近访客 更多访客>>
最新评论
-
stanly7:
lovexp2010 写道LZ加油~~thank you
开始blog -
lovexp2010:
LZ加油~~
开始blog
文章列表
Lucene中文分析器的中文分词准确性和性能比较
作者:approximation 转自:
http://approximation.iteye.com/blog/345885
不是本人所写。
对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。
单纯的中文分词的实现一般为按字索引或者按词索引。按字索引顾名思义,就是按单个字建立索引。按词索引就是按词喽,根据词库中的 ...
在eclipse中配置lucene2的运行环境
如果只是一般性的lucene开发,我觉得没有必要配这个环境。
下载lucene源码,现在是2.4.0。解压在C:\lucene-2.4.0。
eclipse新建java project,在contents选择中选择create project from existing source,选择lucene路径(C:\lucene-2.4.0)。在project name中写lucene-2.4.0。完成
在project的build path加入junit。
完成上述三步,环境基本上就建完了。但在contrib中还会有错误。如果对这里面的东西不感 ...
以前一直觉得自己是学生,对于博客这种东西应该是开始工作的人,为了记录自己的工作才会去写。
慢慢觉得自己作为学生的时候,也还是有很多东西需要去记录,学生时期会做很多东西,作业,替别人做的一些简单的程序,代码也有一些心得,会遇到问题,会解决问题。这些应该都是经验,而不是因为是学生就完全抛弃,然后每次遇到同一个问题的时候,又回头去百度google不停的找答案,最后发现这些东西,我们已经遇到过,只不过是忘记了。
都说好记性不如烂笔头,然而在现在的互联网时代,你要你背着电脑,那就是好记性不如一个文本文档。
现在不知道身边的人有哪些有博客,是不是在写文章,应该很少吧。有时候看到别人写的好的博客文章就 ...