`
stanly7
  • 浏览: 2917 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
Lucene中文分析器的中文分词准确性和性能比较 作者:approximation  转自: http://approximation.iteye.com/blog/345885 不是本人所写。 对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。 单纯的中文分词的实现一般为按字索引或者按词索引。按字索引顾名思义,就是按单个字建立索引。按词索引就是按词喽,根据词库中的 ...
在eclipse中配置lucene2的运行环境 如果只是一般性的lucene开发,我觉得没有必要配这个环境。 下载lucene源码,现在是2.4.0。解压在C:\lucene-2.4.0。 eclipse新建java project,在contents选择中选择create project from existing source,选择lucene路径(C:\lucene-2.4.0)。在project name中写lucene-2.4.0。完成 在project的build path加入junit。 完成上述三步,环境基本上就建完了。但在contrib中还会有错误。如果对这里面的东西不感 ...

开始blog

以前一直觉得自己是学生,对于博客这种东西应该是开始工作的人,为了记录自己的工作才会去写。 慢慢觉得自己作为学生的时候,也还是有很多东西需要去记录,学生时期会做很多东西,作业,替别人做的一些简单的程序,代码也有一些心得,会遇到问题,会解决问题。这些应该都是经验,而不是因为是学生就完全抛弃,然后每次遇到同一个问题的时候,又回头去百度google不停的找答案,最后发现这些东西,我们已经遇到过,只不过是忘记了。 都说好记性不如烂笔头,然而在现在的互联网时代,你要你背着电脑,那就是好记性不如一个文本文档。 现在不知道身边的人有哪些有博客,是不是在写文章,应该很少吧。有时候看到别人写的好的博客文章就 ...
Global site tag (gtag.js) - Google Analytics