阅读更多

6顶
2踩

编程语言

原创新闻 Python也有中文分词程序了- pymmseg-cpp

2008-08-14 14:14 by 见习编辑 robbin 评论(3) 有12224人浏览
JavaEye曾经报道过ruby的中文分词程序:rmmseg-cpp这个项目。rmmseg-cpp实际上是用C++来编写的分词,只在最外层和ruby进行了粘合。

现在作者pluskid(张驰原)在rmmseg-cpp的基础上提供了Python的代码封装,可以用在Python项目当中进行中文分词,用法示例如下:

from pymmseg import mmseg
 
mmseg.dict_load_defaults()
text = # ...
algor = mmseg.Algorithm(text)
for tok in algor:
    print '%s [%d..%d]' % (tok.text, tok.start, tok.end)


该项目源代码在github上面:http://github.com/pluskid/pymmseg-cpp/

作者对于该项目的介绍请看:http://pluskid.lifegoo.com/?p=431

6
2
评论 共 3 条 请登录后发表评论
3 楼 zkl2008_1982 2011-01-18 11:23
牛人们,有个问题问一下:我编程的时候加了utf8格式,而且程序也是在utf8格式下编写的,怎么运行后是乱码?这是怎么回事啊
2 楼 luiqt 2008-10-06 11:40
用下看
分词很重要 对一个2.0网站来说
1 楼 hellas 2008-08-15 12:38
太好了,这个正需要。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • ActiveX component can't create object这个错误怎么解决

    当运行知羽相册软件、知羽平面软件,双击快捷方式后出现“Run-time error '429' AcriveX component can't create object.”的错误提示时,可能是由于以下原因造成: 1、“dao350.dll”文件没注册成功。 2、没有安装SQL Server。 请分别手工注册 dao350.dll 和 scrrun.dll 两个文件。 方法是在“开始”——

  • ActiveX控件:设置控件属性和方法的一种简易办法(VS2013)

    1.项目→属性→配置属性→调试→选择测试容器→确定→调试 2.Ondraw()函数中写代码 3.增加自定义属性:_DXXX(XXX为工程名)→右键→添加→属性→属性名→short→成员变量→生成成员变量和通知函数 4.调试→调用控件→控件→调用方法→Mapropput→参数→调用 5.属性页直接输入Ma 选中资源视图→Dialog→IDD_PROPPAGE_XXX→双击→删除已有 加入静态文本框→右键→属性→Caption→改为Ma 加入编辑框→右键→属性→ID→ID_EDIT_MA 编辑框→右键→

  • ActiveX component can‘t create object

    VB 6.0 ActiveX component can’t create object 使用vbs实现outlook邮件自动发送。 Dim OutApp As Object Dim OutMail As Object Dim Receiver, CReceiver, filepath, titl As String With Application .Ena

  • ‘ActiveX component can’t create object解决方法

    Event Type:    WarningEvent Source:    Health Service ScriptEvent Category:    NoneEvent ID:    1Date:        2/13/2009Time:        12:18:09 PMUser:        N/AComputer:    BADDC01Description:AD Op Mas...

  • VB 6.0 ActiveX component can't create object

    ActiveX 控件没有注册成功,需要注册。具体注册方法:将dll或者ocx或者exe拷贝到c:\windows\system32目录下或者c:\windows\syswow64目录下64位注册要用c:\windows\syswow64\regsvr32 xxxxxxx.ocx或dll32位注册要用c:\windows\system32\regsvr32 xxxxxxx.ocx或dll...

  • Could not initialize class com.jacob.activeX.ActiveXComponent

    nested exception is java.lang.NoClassDefFoundError: Could not initialize class com.jacob.activeX.ActiveXComponent] with root cause java.lang.NoClassDefFoundError: Could not initialize class com.jacob.activeX.ActiveXComponent

  • ActiveX component can't create object doExcel.js报错

    问题描述:网页控件打印功能报错,不能正常打印。另可能报错内容: 标题:TheClassicMenuForExcel2007 主题:Run-time error ‘91’ 解决方法:重新安装OFFICE 或WPS...

  • Web网页中内嵌Activex的Activex插件开发

    转载自: http://blog.csdn.net/tttyd/article/details/5258096 源代码下载 http://files.cnblogs.com/tttyd/Activex.rar 由于在博主的博客中没有讲明工程的创建过程与最后插件的注册方法,我在另一篇文章中作了补充: 用ATL写简单的ActiveX控件   介绍:   如今在许多流媒体视频网站(y

  • Pipelight – 让 Linux 原生 Chromium/Chrome 无缝支持 ActiveX 控件

    工行网银, Silverlight, 支付宝控件, 放开那个 Windows 虚拟机, 让 Wine 上吧~ 无图无真相:    基本的原理是, 利用 Chrome 里已有的 npactivex (ActiveX for Chrome) 扩展, 配合 pipelight 提供的 npactivex NPAPI 插件, 将 ActiveX 控件本身用 wine 执行, 并且无缝地嵌

  • 网页加载ActiveX控件

    我在做网页加载在ActiveX控件需要按一下步骤进行: 1.管理员权限打开终端:输入 regsvr32 xxx.ocx 2.regedit打开注册表,搜索xxx.ocx对应的uuid 3.编写测试html 简单的OCX控件调用 function login() { alert("aaaaaaaaaaaaaaaaaaa"); var palyob

Global site tag (gtag.js) - Google Analytics