`

python调用hanlp分词包手记

阅读更多



 python调用hanlp分词包手记

 

Hanlp作为一款重要的分词工具,本月初的时候看到大快搜索发布了hanlp的1.7版本,新增了文本聚类、流水线分词等功能。关于hanlp1.7版本的新功能,后面有使用的到时候在给大家分享。本篇分享一个在python里调用hanlp分词包的过程文章,供需要的朋友参考学习交流!以下为文章内容:

 

1.在python下安装pyhanlp

sudo pip install pyhanlp

详见pyhanlp官方文档

 

2.pyhanlp的一些使用方法

1)Hanlp.segment的使用

from pyhanlp import *

print HanLP.segment("今天开心了吗?")

#输出:[今天/t, 开心/a, 了/ule, 吗/y, ?/w]

  1. 其它API函数的使用。

    pyhanlp里已经含有以下这些功能了,可以直接调用)

    1 - # API列表

    2CustomDictionary= LazyLoadingJClass('com.hankcs.hanlp.dictionary.CustomDictionary')

    3 HanLP = SafeJClass('com.hankcs.hanlp.HanLP')

    4 HanLP.Config = JClass('com.hankcs.hanlp.HanLP$Config')

    5PerceptronLexicalAnalyzer= SafeJClass('com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer')

    6 DoubleArrayTrieSegment = SafeJClass('com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment')

    7AhoCorasickDoubleArrayTrie = SafeJClass('com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie')

    8IOUtil = SafeJClass('com.hankcs.hanlp.corpus.io.IOUtil')

    9TraditionalChineseTokenizer=SafeJClass('com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer')

     

    调用方法

    analyzer=PerceptronLexicalAnalyzer()

    a =analyzer.analyze("今天开心了吗?")

    print a

     

    3.其它更多的功能的实现。

  1. 比如繁体分词,自动生成摘要这些hanlp能实现的,但不在以上API函数里面的,我们可以通过以下方法。

  2. 首先要在“../pyhanlp/init.py”pycharm文件下通过jclass语句引入更深类路径。比如(我引入的是中文繁体分词这个API函数)

  3. TraditionalChineseTokenizer=SafeJClass('com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer')

  4. 然后就可以直接调用了,真的超级棒。

  5. print TraditionalChineseTokenizer.segment('三華裔獲得傑出青年獎‘)

  6. #输出:[三/m, 華裔/n, 獲得/v, 傑出青年/nz, 獎/n]

  7. -其它更多的API函数的路径请参考java原代码。

    ---------------------

    作者:小傻子kkk

    原文:https://blog.csdn.net/qq_42792935/article/details/81226515

 

  • 大小: 15.6 KB
分享到:
评论

相关推荐

    python调用中文分词.rar

    python调用分词,分词系统只可以用2.6版本,调用的是中文分词,可自己添加词典。演示时可选择计算机一级标注、二级标注、北大一级标注二级标注等选项,上边可输入中文,下边是分词后的效果,运行界面请参考截图区域...

    使用Python调用微信本地ocr服务.zip

    使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip...

    使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip

    使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口...

    python调用大漠插件

    python调用大漠插件python调用大漠插件python调用大漠插件python调用大漠插件

    基于HanLP分词和Bayes分类器实现的问答机器人.zip

    《基于HanLP分词和Bayes分类器实现的问答机器人》是一个典型的自然语言处理(NLP)项目,主要应用于Python编程环境下。这个课程设计旨在帮助学生掌握如何利用现代的NLP工具和技术构建一个智能问答系统。下面将详细...

    HanLP实现文本分词、提取关键词、聚类(工具资源+实例)

    HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法...

    Python 调用Java实例详解

    Python 调用Java实例详解 前言: Python 对服务器端编程不如Java 所以这方面可能要调用Java代码 ...2 调用非jdk的jar包, test.jar 包中含有 com.Test类 package com; public class Test { public Stri

    hanlp在Python环境中的安装

    汉语言处理库(HanLP)在Python环境中的安装是一...总的来说,Python环境中的HanLP安装涉及到Java环境的配置、Python与Java的交互、以及HanLP的具体调用方法。理解这些知识点对于在Python项目中有效利用HanLP至关重要。

    python调用迅雷sdk实现迅雷下载

    python调用迅雷sdk实现迅雷下载,不需要安装迅雷实现迅雷下载,所有调用的接口具体介绍,参考迅雷云加速开放平台文档 http://open.xunlei.com/wiki/tutorial.html 迅雷SDK只提供了32位的版本.所以python版本必须为32位...

    Python调用Prometheus监控数据并计算.zip

    本压缩包文件"Python调用Prometheus监控数据并计算.zip"包含了如何使用Python与Prometheus交互的相关资料,特别是通过Python调用Prometheus的API来获取和处理监控数据。 首先,让我们深入了解Prometheus的核心概念...

    Python调用制冷剂物性参数计算软件Refprop.pdf

    Python调用制冷剂物性参数计算软件Refprop.pdf

    Python 调用C# dll文件

    通过这个库,我们可以直接在Python环境中调用C#编写的DLL,实现两者之间的通信。 **一、安装pythonnet** 在Python中使用`pythonnet`,首先需要安装该库。你可以使用pip来安装: ```bash pip install pythonnet ``...

    Python-自然语言处理工具包HanLP的Python接口

    **Python-自然语言处理工具包HanLP的Python接口** 在Python的世界里,自然语言处理(NLP)是一项关键任务,涉及文本分析、语义理解、情感分析等多个领域。HanLP,由厦门汉云科技有限公司开发,是一款高效、易用的...

    python调用海康SDK拉取网络摄像头视频流

    本篇文章将深入探讨如何使用Python编程语言调用海康威视(Hikvision)的SDK来拉取网络摄像头的视频流。海康威视作为全球领先的安防产品提供商,提供了丰富的SDK供开发者进行二次开发。 首先,我们需要了解海康SDK的...

    使用Python调用Abaqus交互命令

    根据提供的文件信息,知识点主要集中在如何使用Python编程语言来调用Abaqus这一专业有限元分析软件中的交互命令,进而实现自动化分析和模拟的过程,替代传统的图形用户界面(GUI)。由于文件中内容片段不多且存在...

    python调用乐玩多线程.py

    python调用乐玩多线程源码

    python 调用海康SDK 控制摄像头云台代码

    本话题将详细介绍如何使用Python调用海康SDK来实现对摄像头云台的控制。 首先,我们需要理解“云台”是摄像头的一部分,它允许摄像头进行水平和垂直移动,从而扩大监控范围。通过SDK,我们可以精确控制摄像头的方向...

    ctypes库的使用 python调用Windows DLL

    ### ctypes库的使用:Python调用Windows DLL #### 一、ctypes库简介与功能 ctypes 是 Python 的一个标准库模块,它提供了与 C 兼容的数据类型,并且能够轻松地调用 C 库(DLL)中的函数。这对于那些需要与 C 语言...

    python调用DXGI实时快速截屏,是python截屏的最快版了

    总结来说,Python调用DXGI实现快速截屏是通过利用Windows API和DirectX图形接口来获取屏幕图像。这种方式相比于其他Python截图库,如PIL或Scrot,具有更快的速度和更低的延迟,适用于需要高性能实时截屏的场景。不过...

    kmclass驱动级游戏脚本制作 python调用

    为了在Python中调用kmclass驱动,我们需要使用一些特定的技术,比如ctypes库,它能让我们在Python中调用C或C++编写的动态链接库(DLL)。 在提供的压缩包中,我们看到以下几个文件: 1. `kms.py`:这是主程序文件...

Global site tag (gtag.js) - Google Analytics