论坛首页 Java企业应用论坛

中文分词 mmseg4j

浏览 21380 次
该帖已经被评为良好帖
作者 正文
   发表时间:2009-04-15  
楼上的结果, 8.68s 是总时间? user 0.30s 是什么意思,词库加载时间?
0 请登录后投票
   发表时间:2009-04-15  
mikeandmore 写道
囧,为什么出来的结果都是乱码啊。。。。。。


正确编码的Reader应该没有乱码问题。
0 请登录后投票
   发表时间:2009-04-15  
5.57s user
0.28s system
99% cpu
5.871 total

user是用户态的时间。
system是内核态的时间。
0 请登录后投票
   发表时间:2009-04-15  
chenlb 写道
mikeandmore 写道
囧,为什么出来的结果都是乱码啊。。。。。。


正确编码的Reader应该没有乱码问题。

因为Linux是unicode(utf-8)的,不是国标,(GB2312)
0 请登录后投票
   发表时间:2009-04-15  
mikeandmore 写道
chenlb 写道
mikeandmore 写道
囧,为什么出来的结果都是乱码啊。。。。。。


正确编码的Reader应该没有乱码问题。

因为Linux是unicode(utf-8)的,不是国标,(GB2312)



词库,我强制使用 utf-8 编码。

reader 层里没有编码的概念了
0 请登录后投票
   发表时间:2009-04-15  
chenlb 写道
mikeandmore 写道
chenlb 写道
mikeandmore 写道
囧,为什么出来的结果都是乱码啊。。。。。。


正确编码的Reader应该没有乱码问题。

因为Linux是unicode(utf-8)的,不是国标,(GB2312)



词库,我强制使用 utf-8 编码。

reader 层里没有编码的概念了

是你的Performance.java里面hardcode的。。嘿嘿
0 请登录后投票
   发表时间:2009-04-15  
哦, 那个是我本机上测的, 没打包到 jar 里。

呵呵
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics