该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2009-12-11
jimlgx 写道 发现IK Analyzer 3.2.0中一个问题:
当使用自定义词库的时候,字典文件不能有空行, 出现空行会发生,数组越界异常 查阅代码发现时 源码没有对 行内容长度做不为0判断, 所以出现数组越界,希望及时更正, 或者作者有什么特殊含义 感谢您的反馈,这个细节方面确实做的不够好,我们会尽快修订。 |
|
返回顶楼 | |
发表时间:2009-12-16
哥哥这个版本不释放内存。。。。
|
|
返回顶楼 | |
发表时间:2009-12-16
ansjsun 写道 哥哥这个版本不释放内存。。。。
没明白你的意思,能否说明的更清晰一些。 顺便说一下,IK的任何版本都需要至少23-27M左右的内存来存放词典,这块内存是不可能释放的。另外分词过程中的大部分变量都是本地变量,基本上也没有内存的占用。我猜测你是看到IK的词典暂用的内存了。 |
|
返回顶楼 | |
发表时间:2009-12-16
谢谢!这个很有用。
我已经将IKAnalyzer包括到软件DBSight里了。 http://www.dbsight.net |
|
返回顶楼 | |
发表时间:2009-12-16
chrislusf 写道 谢谢!这个很有用。
我已经将IKAnalyzer包括到软件DBSight里了。 http://www.dbsight.net 哇,很cool啊,要向你学习了,这么大的东东就你一个人折腾啊,牛!! |
|
返回顶楼 | |
发表时间:2009-12-17
不敢当。IKAnalyzer更有名呀。DBSight还没有很多人知道。
其实DBSight是个很好的工具,省去了重新发明轮子的工作。免费版的功能几乎都有。欢迎用用,提出建议。我会改进的。谢谢! |
|
返回顶楼 | |
发表时间:2009-12-21
太cool了,更新很及时呢,支持了lucene3.0,希望尽快放出3.2.0的zip格式源码包,svn不如直接下zip爽啊.一直坚持着ik的更新,向你致敬~
|
|
返回顶楼 | |
发表时间:2010-01-11
比较关心和paoding的性能比较,呵呵
|
|
返回顶楼 | |
发表时间:2010-01-11
zxzheaven 写道 比较关心和paoding的性能比较,呵呵
最好自己测试吧,呵呵有说快有说慢的,不如自己动手比较一下。 个人认为,分词器到了一定解析速度后,速度已经不是问题,关键是效果了。 |
|
返回顶楼 | |
发表时间:2010-01-12
我想遍历一个字符串的每一个字符,以前是用string.toCharArray()来转换成一个char[]一个一个看的
不过我看到有些,特别是lucene的分词器,他们都是用的stringreader来遍历一个字符串的 是不是stringreader要比string.toCharArray()换成的char[]要来的快? |
|
返回顶楼 | |