代码很简单,但我自己摸索了一下午
#coding:gb2312
from ctypes import *
dll=cdll.LoadLibrary("ICTCLAS30.dll")
dll.ICTCLAS_Init(c_char_p("."))
lpText = u"计算所汉语词法分析系统ICTCLAS调用测试"
bSuccess = dll.ICTCLAS_ParagraphProcess(c_char_p(lpText), 1)
print c_char_p(bSuccess).value,lpText
dll.ICTCLAS_Exit()
把这个文件同ICTALAS30.DLL ,DATA文件夹,Configure.xm l放在同一个目录下即可。
模块化设计如下:
#coding:gb2312
from ctypes import *
import re
class ictclas:
def __init__(self):
self.dll=cdll.LoadLibrary("ICTCLAS30.dll")
self.dll.ICTCLAS_Init(c_char_p("."))
def exit(self):
self.dll.ICTCLAS_Exit()
def addDict(self,dictpath):
self.dll.ICTCLAS_ImportUserDict(c_char_p(dictpath));
self.dll.ICTCLAS_SaveTheUsrDic()
def procss(self,text):
bSuccess=self.dll.ICTCLAS_ParagraphProcess(c_char_p(text), 1)
return c_char_p(bSuccess).value
if __name__=="__main__":
fenci=ictclas()
#fenci.addDict('d://pku-words.txt')
print fenci.procss('亚太经合组织欢迎你')
fenci.exit()
分享到:
相关推荐
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。这是该软件的2015版本,欢迎各位学者下载使用。
采用Java实现分词系统,包括去除停用词,文本处理完毕后输出到txt
为此,中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;...
带分词词性分类,VS2008项目,可以直接运行Demo程序,效果棒棒哒!
中科院ICTCLAS2014分词系统下载包
ICTCLAS中文分词系统是基于信息技术(ICT)和自然语言处理(NLP)的工具,主要用于处理中文文本。这个系统由中关村的科研团队开发,代表着国内在中文分词技术领域的先进水平。分词是中文信息处理的重要步骤,因为...
中科院分词(ICTCLAS30.dll),去除时间限制破解版。 只是包含DLL文件,不含其他文件。
ICTCLAS 中文分词 中科院 ICTCLAS 中文分词 中科院
最好的中文分词算法,新鲜出炉,不过里面的文件是2014的
在实际使用ICTCLAS Java分词系统时,开发者需要将这些文件部署到相应的环境中,并通过Java API来调用分词功能。例如,可以加载`ICTCLAS.dll`或`jawin.library`,然后调用预定义的分词方法,传入待分词的文本,系统会...
实现了用java调用中科院分词工具。可用于软件或者web工程。
ik分词和ictclas分词两者结合,可使得分词结果更加精准。
计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll,COM组件和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,...
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;...
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;...
最好的中分分词工具ictclas 最好的中分分词工具ictclas 最好的中分分词工具ictclas
中文分词标注软件,开源版ICTCLAS,C++环境,用用还不错。
ICTCLAS中文分词系统C++代码,内容很强大,很好。ICTCLAS中文分词系统是目前世界最好的分词系统
java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典...