`
ipython
  • 浏览: 295759 次
  • 性别: Icon_minigender_1
  • 来自: 佛山
社区版块
存档分类
最新评论

python 中文分词,安装 pymmseg

阅读更多

在python这pymmseg-cpp 还是十分方便的! 

 

环境 ubuntu10.04 , python2.65

 

步骤:

1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/

2  tar -zxf pymmseg-cpp*.tar.gz           //解压后得到pymmseg 目录

    cd pymmseg\mmseg-cpp

    python build.py     #生成 mmseg.so文件

 

3 将 pymmseg 目录复制到 /usr/local/lib/python2.6/dist-packages 中

 

 

4 测试有没有成功:

  test.py

 

from pymmseg import mmseg 
mmseg.dict_load_defaults()  
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)  
for tok in algor:  
    print '%s [%d..%d]' % (tok.text, tok.start, tok.end)  
 

 

 

分享到:
评论

相关推荐

    Python中文分词实现方法(安装pymmseg)

    本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下: 在Python这pymmseg-cpp 还是十分方便的! 环境 ubuntu10.04 , python2.65 步骤: 1 下载mmseg-cpp的源代码 ...

    pymmseg-cpp python中文分词

    pymmseg-cpp is a Python port of the rmmseg-cpp project. rmmseg-cpp is a MMSEG Chinese word segmenting algorithm implemented in C++ with a Python interface.

    pymmseg -python分词模块

    python分词模块,基于mmseg算法编写,核心代码c++,提供python接口

    64位编译完成的pymmseg

    site-packages是Python默认的第三方模块安装位置,将此库放在此处可以使Python环境识别并加载pymmseg。 标签“python, pymmseg”明确了这个模块是用Python语言编写,并且是pymmseg项目的一部分。Python因其简洁的...

Global site tag (gtag.js) - Google Analytics