锁定老帖子 主题:中文分词 mmseg4j
该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2009-04-02
whaosoft 写道 你自己写的???
是我自己写的, 有问题吗? |
|
返回顶楼 | |
发表时间:2009-04-03
chenlb 写道 whaosoft 写道 你自己写的???
是我自己写的, 有问题吗? ![]() ![]() |
|
返回顶楼 | |
发表时间:2009-04-03
whaosoft 写道 你自己写的???
在JE, 遇到牛的机会很多, 故请不要见怪. ![]() |
|
返回顶楼 | |
发表时间:2009-04-06
哇塞。。。
汗一个 中文分词大学接触过一点点,楼主你不错 |
|
返回顶楼 | |
发表时间:2009-04-06
赞...
话说可以考虑跟我的segc PK试试看...哈哈... http://github.com/mikeandmore/segc/tree/master |
|
返回顶楼 | |
发表时间:2009-04-06
mikeandmore 写道 赞...
话说可以考虑跟我的segc PK试试看...哈哈... http://github.com/mikeandmore/segc/tree/master PK 那方面? |
|
返回顶楼 | |
发表时间:2009-04-07
http://groups.google.com/group/mmseg
这是solol 较早前实现的MMSEG分词的java版本。 |
|
返回顶楼 | |
发表时间:2009-04-07
我想我是海 写道 顶最早的mmseg for java的 Solol兄。由于其网站过期而弃用了。已通知solol放出原版下载。
我想我是海 写道 http://groups.google.com/group/mmseg
这是solol 较早前实现的MMSEG分词的java版本。 你比较喜欢顶 solol 兄, ![]() 顶 solol 兄是你的自由, 写 mmseg4j 是我的自由。你甚至还可以为 solol 兄的mmseg扩展lucene analyzer 我写 mmseg4j 的目的很简单:学习一种分词算法。 |
|
返回顶楼 | |
发表时间:2009-04-07
chenlb 写道 mikeandmore 写道 赞...
话说可以考虑跟我的segc PK试试看...哈哈... http://github.com/mikeandmore/segc/tree/master PK 那方面? 呃。。。忘了说了。。。 性能。。我这个项目的目的是性能的。。。 ![]() |
|
返回顶楼 | |
发表时间:2009-04-07
最后修改:2009-04-07
mikeandmore 写道 呃。。。忘了说了。。。
性能。。我这个项目的目的是性能的。。。 ![]() 1.5版的分词速度simple算法是 1100kb/s左右、complex算法是 700kb/s左右,(测试机:AMD athlon 64 2800+ 1G内存 xp)。 simple > paoding(900Kb/s左右) > complex > ik & mik > je 后续的版本努力提升性能.... |
|
返回顶楼 | |