精华帖 (1) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2009-08-01
rongxh7 写道 linliangyi2007 写道 rongxh7 写道 楼主,您好!
研读IK 3.x 的源码,发现没有了正向最大匹配的中文分词,我们的项目急需正向最大匹配,而想改ChineseSegmenter,发觉代码执行的流程有点复杂,本人比较愚笨,看了一天,也没看全懂! 我们想将ChineseSegmenter改成正向最大匹配的,应该怎么做?请楼主指点一二!谢谢! 如:人类互联网史 IK3分词成: 人类 互联网 互联 联网 史 我们想要的结果是: 人类 互联网 史 OK,那就出个3.1.1吧,周末就出个版本哈 太好了,楼主真好人!期待带有正向最大匹配分词功能的IK3.1.1! IK3.1.1GA 已经发布 http://linliangyi2007.iteye.com/blog/437550 |
|
返回顶楼 | |
发表时间:2009-08-01
动作也太快一点了吧。。
|
|
返回顶楼 | |
发表时间:2009-08-01
langhua9527 写道 动作也太快一点了吧。。
呵呵,昨晚折腾到凌晨4点哦 |
|
返回顶楼 | |
发表时间:2009-08-01
我也要正向最大匹配。真是太好了!!!真是好人!!!
|
|
返回顶楼 | |
发表时间:2009-08-02
向楼主的这种精神致敬!
|
|
返回顶楼 | |
发表时间:2009-08-03
楼主的分词很不错,赞一个.
|
|
返回顶楼 | |
发表时间:2009-08-03
O,3.1.1GA又出来了。。。更新很频繁,项目很活跃。。。
|
|
返回顶楼 | |
发表时间:2009-08-04
楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0 at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47) |
|
返回顶楼 | |
发表时间:2009-08-04
crazy_001 写道 楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0 at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47) 你用的那个版本?3.0在切分数词时,有这个bug,请使用IK3.1GA以上版本 另外你进行分词的文字能发给我看一下嘛? |
|
返回顶楼 | |
发表时间:2009-08-04
linliangyi2007 写道 crazy_001 写道 楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0 at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47) 你用的那个版本?3.0在切分数词时,有这个bug,请使用IK3.1GA以上版本 另外你进行分词的文字能发给我看一下嘛? 我用的是从svn上更新下来的,应该是最新的,可能跟数据长度有关吧,我把数据也上传一下,你测试看看 |
|
返回顶楼 | |