python调用hanlp分词包手记
Hanlp作为一款重要的分词工具,本月初的时候看到大快搜索发布了hanlp的1.7版本,新增了文本聚类、流水线分词等功能。关于hanlp1.7版本的新功能,后面有使用的到时候在给大家分享。本篇分享一个在python里调用hanlp分词包的过程文章,供需要的朋友参考学习交流!以下为文章内容:
1.在python下安装pyhanlp
sudo pip install pyhanlp
(详见pyhanlp官方文档)
2.pyhanlp的一些使用方法
(1)Hanlp.segment的使用
from pyhanlp import *
print HanLP.segment("今天开心了吗?")
#输出:[今天/t, 开心/a, 了/ule, 吗/y, ?/w]
-
其它API函数的使用。
(pyhanlp里已经含有以下这些功能了,可以直接调用)
1 - # API列表
2CustomDictionary= LazyLoadingJClass('com.hankcs.hanlp.dictionary.CustomDictionary')
3 HanLP = SafeJClass('com.hankcs.hanlp.HanLP')
4 HanLP.Config = JClass('com.hankcs.hanlp.HanLP$Config')
5PerceptronLexicalAnalyzer= SafeJClass('com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer')
6 DoubleArrayTrieSegment = SafeJClass('com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment')
7AhoCorasickDoubleArrayTrie = SafeJClass('com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie')
8IOUtil = SafeJClass('com.hankcs.hanlp.corpus.io.IOUtil')
9TraditionalChineseTokenizer=SafeJClass('com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer')
调用方法
analyzer=PerceptronLexicalAnalyzer()
a =analyzer.analyze("今天开心了吗?")
print a
3.其它更多的功能的实现。
-
比如繁体分词,自动生成摘要这些hanlp能实现的,但不在以上API函数里面的,我们可以通过以下方法。
-
首先要在“../pyhanlp/init.py”pycharm文件下通过jclass语句引入更深类路径。比如(我引入的是中文繁体分词这个API函数)
-
TraditionalChineseTokenizer=SafeJClass('com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer')
-
然后就可以直接调用了,真的超级棒。
-
print TraditionalChineseTokenizer.segment('三華裔獲得傑出青年獎‘)
-
#输出:[三/m, 華裔/n, 獲得/v, 傑出青年/nz, 獎/n]
-
-其它更多的API函数的路径请参考java原代码。
---------------------
作者:小傻子kkk
原文:https://blog.csdn.net/qq_42792935/article/details/81226515
相关推荐
使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip...
使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口...
python调用大漠插件python调用大漠插件python调用大漠插件python调用大漠插件
《基于HanLP分词和Bayes分类器实现的问答机器人》是一个典型的自然语言处理(NLP)项目,主要应用于Python编程环境下。这个课程设计旨在帮助学生掌握如何利用现代的NLP工具和技术构建一个智能问答系统。下面将详细...
HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法...
在Linux环境下,使用Python调用海康威视(Hikvision)的SDK包是一个常见的任务,这主要涉及到视频监控系统的远程访问和控制。海康威视作为全球领先的安防产品及解决方案提供商,提供了丰富的SDK供开发者集成到自己的...
运用python进行调用中科院分词系统已达到分词的目的 里面包含各个接口调用函数的详细介绍,极大程度的方便了开发者研究分词。可以直接运行。
python调用迅雷sdk实现迅雷下载,不需要安装迅雷实现迅雷下载,所有调用的接口具体介绍,参考迅雷云加速开放平台文档 http://open.xunlei.com/wiki/tutorial.html 迅雷SDK只提供了32位的版本.所以python版本必须为32位...
Python调用制冷剂物性参数计算软件Refprop.pdf
本压缩包文件"Python调用Prometheus监控数据并计算.zip"包含了如何使用Python与Prometheus交互的相关资料,特别是通过Python调用Prometheus的API来获取和处理监控数据。 首先,让我们深入了解Prometheus的核心概念...
"python调用sac"则是指利用Python的子进程管理模块(如os或subprocess)直接调用SAC的命令行工具。这种方式虽然没有直接利用`pythonsac`库那样方便,但能调用SAC的所有功能,适用于处理`pythonsac`库不支持或者需要...
Python调用海康威视(HIKVision)SDK来实现图像处理和视频流操作是许多开发者在物联网(IoT)和监控系统中的常见需求。海康威视作为全球领先的安防产品供应商,提供了丰富的SDK供开发者集成到自己的应用程序中。在这个...
`ctypes`是Python的一个标准库,它允许我们直接调用C语言编译的动态链接库,从而实现了Python与C/C++代码的交互。 首先,我们需要理解DLL是什么。DLL(Dynamic Link Library)是Windows操作系统中的一个共享库,...
**Python-自然语言处理工具包HanLP的Python接口** 在Python的世界里,自然语言处理(NLP)是一项关键任务,涉及文本分析、语义理解、情感分析等多个领域。HanLP,由厦门汉云科技有限公司开发,是一款高效、易用的...
本教程聚焦于如何在Linux环境下使用C++编写`.so`动态链接库,并通过Python进行调用,这对于初学者来说是一个很好的实践项目。`.so`文件是Linux系统中的动态链接库,它包含可被其他程序共享的函数和数据。 首先,...
本案例主要探讨如何使用Python调用C代码,并结合Visual Studio 2005(VS2005)创建的工程来编译生成动态链接库(DLL)或Python的扩展模块(pyd文件),供Python调用。 首先,我们需要了解Python的C API,它是Python...
总结来说,Python调用DXGI实现快速截屏是通过利用Windows API和DirectX图形接口来获取屏幕图像。这种方式相比于其他Python截图库,如PIL或Scrot,具有更快的速度和更低的延迟,适用于需要高性能实时截屏的场景。不过...
本话题将详细介绍如何使用Python调用海康SDK来实现对摄像头云台的控制。 首先,我们需要理解“云台”是摄像头的一部分,它允许摄像头进行水平和垂直移动,从而扩大监控范围。通过SDK,我们可以精确控制摄像头的方向...
Python在IT领域中被广泛用于自动化任务,包括与硬件设备的交互,如调用打印机进行文档打印。在处理PDF文件时,Python提供了多种方法来实现这一功能,其中一个常见的方式是利用第三方库。在这个场景中,我们关注的是...
本篇文章将深入探讨如何使用Python编程语言调用海康威视(Hikvision)的SDK来拉取网络摄像头的视频流。海康威视作为全球领先的安防产品提供商,提供了丰富的SDK供开发者进行二次开发。 首先,我们需要了解海康SDK的...