论坛首页 Java企业应用论坛

发布IK Analyzer 3.1 GA升级包

浏览 7727 次
精华帖 (1) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2009-08-01  
rongxh7 写道
linliangyi2007 写道
rongxh7 写道
楼主,您好!
研读IK 3.x 的源码,发现没有了正向最大匹配的中文分词,我们的项目急需正向最大匹配,而想改ChineseSegmenter,发觉代码执行的流程有点复杂,本人比较愚笨,看了一天,也没看全懂!
我们想将ChineseSegmenter改成正向最大匹配的,应该怎么做?请楼主指点一二!谢谢!
如:人类互联网史
IK3分词成:
人类
互联网
互联
联网


我们想要的结果是:
人类
互联网


OK,那就出个3.1.1吧,周末就出个版本哈


太好了,楼主真好人!期待带有正向最大匹配分词功能的IK3.1.1!


IK3.1.1GA 已经发布 http://linliangyi2007.iteye.com/blog/437550
0 请登录后投票
   发表时间:2009-08-01  
动作也太快一点了吧。。
0 请登录后投票
   发表时间:2009-08-01  
langhua9527 写道
动作也太快一点了吧。。


呵呵,昨晚折腾到凌晨4点哦
0 请登录后投票
   发表时间:2009-08-01  
我也要正向最大匹配。真是太好了!!!真是好人!!!
0 请登录后投票
   发表时间:2009-08-02  
向楼主的这种精神致敬!
0 请登录后投票
   发表时间:2009-08-03  
楼主的分词很不错,赞一个.
0 请登录后投票
   发表时间:2009-08-03  
O,3.1.1GA又出来了。。。更新很频繁,项目很活跃。。。
0 请登录后投票
   发表时间:2009-08-04  
楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0
at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47)
0 请登录后投票
   发表时间:2009-08-04  
crazy_001 写道
楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0
at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47)


你用的那个版本?3.0在切分数词时,有这个bug,请使用IK3.1GA以上版本

另外你进行分词的文字能发给我看一下嘛?
0 请登录后投票
   发表时间:2009-08-04  
linliangyi2007 写道
crazy_001 写道
楼主,你好!我以前也用过这个分词,觉得不错,看了你发布新版的,也拿来试试看,但在建索引的时候会报出以下异常,不知道算不算bug:
Exception in thread "main" java.lang.IllegalArgumentException: length < 0
at org.wltea.analyzer.Lexeme.<init>(Lexeme.java:47)


你用的那个版本?3.0在切分数词时,有这个bug,请使用IK3.1GA以上版本

另外你进行分词的文字能发给我看一下嘛?

我用的是从svn上更新下来的,应该是最新的,可能跟数据长度有关吧,我把数据也上传一下,你测试看看
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics