1、hanlp简介
HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
开源网址:HanLP: Han Language Processing
但由于hanlp是用java来实现的,要在python中使用hanlp,只能通过调用pyhanlp这个包来。
但是pyhanlp里面有一些功能仍然不支持python直接调用,比如汉字转拼音,这时候就需要从python中启动jvm并指定Hanlp的jar路径来使用其他功能了。
2、下载并配置文件
(1)从开源网址中下载jar、data、hanlp.properties并修改配置文件:
1、下载:data.zip
下载后解压到任意目录,接下来通过配置文件hanlp.properties告诉HanLP数据包的位置。
data
│
├─dictionary
└─model
用户可以自行增删替换,如果不需要句法分析等功能的话,随时可以删除model文件夹。
3、下载jar和配置文件:hanlp-release.zip
(1)配置文件hanlp.properties的作用是告诉HanLP数据包的位置,只需修改第一行为data的父目录即可:
root=D:/JavaProjects/HanLP/
比如data目录是/Users/hankcs/Documents/data,那么root=/Users/hankcs/Documents/ 。
(2)从python中启动jvm以及添加jar包路径
其中-Djava.class.path是用来添加jar包到classpath中,然后用startJVM来启动jvm。
startJVM第一个参数是系统内的jvm位置,第二个为*arg参数,此处放置classpath。
以上得到的是java的ArrayList类型,需要将他装换为string类型:
结果如下:
4、最后记得关闭JVM
--------------------
相关推荐
使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip使用Python调用微信本地ocr服务.zip...
使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口调用python库源码.zip使用Python调用OpenAI接口-OpenAI接口...
python 连续拼音转中文,运用到了Pinyin2Hanzi,可以参考一下
Python 调用Java实例详解 前言: Python 对服务器端编程不如Java 所以这方面可能要调用Java代码 前提: Linux 环境 1 安装 jpype1 安装后测试代码: from jpype import * startJVM(getDefaultJVMPath(), "-ea...
豆包 API 调用示例代码详解-Python版 在本文中,我们将详细介绍如何使用 Python 调用豆包 API,并提供相关的事前准备和代码执行步骤。 一、事前准备 密钥申请: 要使用豆包 API,首先需要申请一个授权密钥。在上述...
根据提供的文件信息,知识点主要集中在如何使用Python编程语言来调用Abaqus这一专业有限元分析软件中的交互命令,进而实现自动化分析和模拟的过程,替代传统的图形用户界面(GUI)。由于文件中内容片段不多且存在...
go 中的 cgo 模块可以让 go 无缝调用 c 或者 c++ 的代码,而 python 本身就是个 c 库,自然也可以由 cgo 直接调用,前提是指定正确的编译条件,如 Python.h 头文件(),以及要链接的库文件。本文以 Ubuntu 18.04 ...
### ctypes库的使用:Python调用Windows DLL #### 一、ctypes库简介与功能 ctypes 是 Python 的一个标准库模块,它提供了与 C 兼容的数据类型,并且能够轻松地调用 C 库(DLL)中的函数。这对于那些需要与 C 语言...
本篇将详细介绍如何使用Python调用SAC脚本以及处理地震数据的相关知识点。 首先,`pythonsac`是Python中用于操作SAC的一个接口库,它允许用户在Python环境中直接执行SAC命令,从而实现对地震数据的处理。通过`...
python调用乐玩多线程源码
python调用大漠插件python调用大漠插件python调用大漠插件python调用大漠插件
在IT行业中,中文汉字转拼音是一项常见的需求,特别是在文本处理、搜索引擎优化(SEO)、语音合成等领域。本篇文章将深入探讨中文汉字转拼音的最简便方法,以及如何在实际开发中应用。 首先,我们需要理解什么是...
本话题将详细介绍如何使用Python调用海康SDK来实现对摄像头云台的控制。 首先,我们需要理解“云台”是摄像头的一部分,它允许摄像头进行水平和垂直移动,从而扩大监控范围。通过SDK,我们可以精确控制摄像头的方向...
Python-pinyin是一个强大的开源库,专门用于将汉字转换为拼音,尤其在处理中文文本时非常有用。这个库基于Python编程语言,使得开发者可以方便地在各种应用场景中进行汉字与拼音的交互,例如自然语言处理、搜索引擎...
### Python调用公有云API操作手册:腾讯云SDK3.0详解 #### 简介 本操作手册旨在帮助用户了解如何使用Python语言通过腾讯云SDK3.0调用公有云API来管理和操作腾讯云的产品和服务。腾讯云开发者工具套件(SDK)3.0是一...
python调用迅雷sdk实现迅雷下载,不需要安装迅雷实现迅雷下载,所有调用的接口具体介绍,参考迅雷云加速开放平台文档 http://open.xunlei.com/wiki/tutorial.html 迅雷SDK只提供了32位的版本.所以python版本必须为32位...
此外,实现汉字转拼音还可以考虑使用开源项目,如Pinyin4j(Java)、PyPinyin(Python)等,它们提供了丰富的功能和良好的社区支持。但如果你选择使用提供的库文件,那么你需要对C++或C#等支持DLL导入的语言有一定...
### Python调用WEBSERVICE接口知识点详解 #### 一、基础知识概述 1. **Web Service**:一种跨编程语言和操作系统平台的远程调用技术,它通过HTTP协议提供服务,可以被任何其他系统调用。 2. **SOAP(Simple Object...
本文将深入探讨如何使用Python调用C#编写的DLL动态链接库文件,主要涉及`pythonnet`库的使用。 首先,`pythonnet`是Python的一个库,它允许Python程序无缝地访问.NET Framework的类型和方法。通过这个库,我们可以...
本压缩包文件"Python调用Prometheus监控数据并计算.zip"包含了如何使用Python与Prometheus交互的相关资料,特别是通过Python调用Prometheus的API来获取和处理监控数据。 首先,让我们深入了解Prometheus的核心概念...