论坛首页 Java企业应用论坛

发布IKAnnlyzer3.2.0稳定版 for Lucene3.0

浏览 28160 次
该帖已经被评为良好帖
作者 正文
   发表时间:2009-12-11  
jimlgx 写道
发现IK Analyzer 3.2.0中一个问题:

当使用自定义词库的时候,字典文件不能有空行,
出现空行会发生,数组越界异常

查阅代码发现时 源码没有对 行内容长度做不为0判断,
所以出现数组越界,希望及时更正,

或者作者有什么特殊含义 



感谢您的反馈,这个细节方面确实做的不够好,我们会尽快修订。
0 请登录后投票
   发表时间:2009-12-16  
哥哥这个版本不释放内存。。。。
0 请登录后投票
   发表时间:2009-12-16  
ansjsun 写道
哥哥这个版本不释放内存。。。。


没明白你的意思,能否说明的更清晰一些。
顺便说一下,IK的任何版本都需要至少23-27M左右的内存来存放词典,这块内存是不可能释放的。另外分词过程中的大部分变量都是本地变量,基本上也没有内存的占用。我猜测你是看到IK的词典暂用的内存了。
0 请登录后投票
   发表时间:2009-12-16  
谢谢!这个很有用。

我已经将IKAnalyzer包括到软件DBSight里了。
http://www.dbsight.net
0 请登录后投票
   发表时间:2009-12-16  
chrislusf 写道
谢谢!这个很有用。

我已经将IKAnalyzer包括到软件DBSight里了。
http://www.dbsight.net


哇,很cool啊,要向你学习了,这么大的东东就你一个人折腾啊,牛!!
0 请登录后投票
   发表时间:2009-12-17  
不敢当。IKAnalyzer更有名呀。DBSight还没有很多人知道。

其实DBSight是个很好的工具,省去了重新发明轮子的工作。免费版的功能几乎都有。欢迎用用,提出建议。我会改进的。谢谢!
0 请登录后投票
   发表时间:2009-12-21  
太cool了,更新很及时呢,支持了lucene3.0,希望尽快放出3.2.0的zip格式源码包,svn不如直接下zip爽啊.一直坚持着ik的更新,向你致敬~
0 请登录后投票
   发表时间:2010-01-11  
比较关心和paoding的性能比较,呵呵
0 请登录后投票
   发表时间:2010-01-11  
zxzheaven 写道
比较关心和paoding的性能比较,呵呵


最好自己测试吧,呵呵有说快有说慢的,不如自己动手比较一下。

个人认为,分词器到了一定解析速度后,速度已经不是问题,关键是效果了。
0 请登录后投票
   发表时间:2010-01-12  
我想遍历一个字符串的每一个字符,以前是用string.toCharArray()来转换成一个char[]一个一个看的

不过我看到有些,特别是lucene的分词器,他们都是用的stringreader来遍历一个字符串的

是不是stringreader要比string.toCharArray()换成的char[]要来的快?
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics