锁定老帖子 主题:中文分词 mmseg4j
该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2009-04-15
楼上的结果, 8.68s 是总时间? user 0.30s 是什么意思,词库加载时间?
|
|
返回顶楼 | |
发表时间:2009-04-15
mikeandmore 写道 囧,为什么出来的结果都是乱码啊。。。。。。
正确编码的Reader应该没有乱码问题。 |
|
返回顶楼 | |
发表时间:2009-04-15
5.57s user
0.28s system 99% cpu 5.871 total user是用户态的时间。 system是内核态的时间。 |
|
返回顶楼 | |
发表时间:2009-04-15
chenlb 写道 mikeandmore 写道 囧,为什么出来的结果都是乱码啊。。。。。。
正确编码的Reader应该没有乱码问题。 因为Linux是unicode(utf-8)的,不是国标,(GB2312) |
|
返回顶楼 | |
发表时间:2009-04-15
mikeandmore 写道 chenlb 写道 mikeandmore 写道 囧,为什么出来的结果都是乱码啊。。。。。。
正确编码的Reader应该没有乱码问题。 因为Linux是unicode(utf-8)的,不是国标,(GB2312) 词库,我强制使用 utf-8 编码。 reader 层里没有编码的概念了 |
|
返回顶楼 | |
发表时间:2009-04-15
chenlb 写道 mikeandmore 写道 chenlb 写道 mikeandmore 写道 囧,为什么出来的结果都是乱码啊。。。。。。
正确编码的Reader应该没有乱码问题。 因为Linux是unicode(utf-8)的,不是国标,(GB2312) 词库,我强制使用 utf-8 编码。 reader 层里没有编码的概念了 是你的Performance.java里面hardcode的。。嘿嘿 |
|
返回顶楼 | |
发表时间:2009-04-15
哦, 那个是我本机上测的, 没打包到 jar 里。
呵呵 |
|
返回顶楼 | |