`

中文自然语言处理工具HanLP源码包的下载使用记录

 
阅读更多


这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧!

不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友,分别是《NLP汉语自然语言处理原理与实战》,里面介绍了汉语自然语言处理的相关技术,还有一些源码的解读;另一本是《python自然语言处理》。

下面就进入到本篇的正题,其实只需要下载源代码,下载字典和模型数据文件、下载配置文件,并且对配置文件稍作修改,然后再使用IDE打开源代码,就可以运行了,总的来说整个过程其实并不复杂。源代码、字典以及模型、配置文件的下载大家可以到GitHub上下载。

网页中提供了详细的说明,其实按照说明来就可以,下载以后将字典和模型文件解压到一个目录,建议放在工程名目录下



 

data中就是模型文件和字典数据文件:

 



 

通过github提供的源代码下载链接下载下来的文件不包含hanlp.properties配置文件,这是你需要下载一个release版本的代码,解压以后,里面有一个hanlp.properties文件



 

 

将这个文件分别拷贝到解压以后的源代码target/classes和target-classes目录下 



 

最后用ide打开源代码,我使用的ide工具是IDEA(Intellij),其他ide的操作应该大同小异,当然配置文件也许只需要一份就够了,不需要两个目录都拷贝,我这里没有验证,为保险起见,两个目录下都拷贝一份,读者可以试验一下,我这里主要目的是为了能跑通。

 

上述步骤完成之后,打开src/test/java/com.hankcs/demo下的demo,就可以跑出结果了,接下来,就顺藤摸瓜去读源代码吧



 

  • 大小: 38.2 KB
  • 大小: 25.1 KB
  • 大小: 65.8 KB
  • 大小: 29.2 KB
  • 大小: 90.6 KB
分享到:
评论

相关推荐

    HanLP自然语言处理

    HanLP,全称为“哈工大讯飞自然语言处理工具包”,是由一系列先进的模型和算法构建的Java库,旨在推动NLP技术在实际生产环境中的广泛应用。本文将深入探讨HanLP的功能、特性以及其在分词领域的应用。 首先,HanLP的...

    hanlp 自然语言处理入门

    在"hanlp 自然语言处理入门"的学习资料中,我们可以期待涵盖一系列基础到进阶的NLP概念和技术。这里我们将深入探讨其中的关键知识点。 首先,Python-3.8.10-amd64.exe是一个Python编程环境的安装程序,Python是NLP...

    Python-自然语言处理工具包HanLP的Python接口

    **Python-自然语言处理工具包HanLP的Python接口** 在Python的世界里,自然语言处理(NLP)是一项关键任务,涉及文本分析、语义理解、情感分析等多个领域。HanLP,由厦门汉云科技有限公司开发,是一款高效、易用的...

    hanlp1.7jar包下载

    汉语文本处理库HanLP是Java开发的一个高效、易用的自然语言处理工具包,主要用于中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等任务。标题“hanlp1.7jar包下载”表明我们要讨论的是HanLP的1.7版本...

    hanlp jar 包

    总之,`HanLP`是一个强大的自然语言处理工具,通过提供的jar包,开发者可以在Java环境中轻松集成和利用其丰富的功能。而`HanLP`的Solr插件则进一步增强了Solr的中文处理能力,使得搜索引擎能够更好地理解和处理中文...

    HanLP:汉语语言处理-源码

    HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 HanLP提供下列功能: 中文...

    基于HanLP自然语言处理包的elasticsearch分词器 hanlp-tokenizer-master

    基于HanLP自然语言处理包的elasticsearch分词器 功能 本分词器使用HanLP提供的维特比分词 屏蔽了本地配置用户词典 增加同义词索引功能 增加远程词典热更新(用户词典,停词典,同义词典) 使用 目前支持的es版本为...

    Hanlp最新版本V1.7.2(含hanlp-1.7.2.jar、模型data包、配置文件hanlp.properties)

    汉语言处理库HanLP是Java实现的自然语言处理(NLP)工具,广泛应用于文本分析、信息提取、情感分析等领域。最新版本V1.7.2包含了一系列优化和新功能,使得它在处理汉语文本时更为高效和准确。这次发布的压缩包提供了...

    自然语言处理 NLP HANLP data-for-1.7.5.zip data-for-1.8.4.rar 训练模型

    概要:HANLP 1.x 数据包兼容data-for-1.7.5.zip ...场景:NLP 自然语言处理 HANLP 训练模型 CRF perceptron model 下载 cws.txt.bin ner.txt.bin pos.txt.bin cws.bin ner.bin pos.bin NNParserModel.txt.bin

    hanlp1.8.3jar包下载

    hanlp,hankcs,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词调、词性标注),命名实体识别(中国人民、音译人民、日本人民,地名,实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,...

    HanLP-1.7.5.zip

    总之,HanLP是一个强大而全面的自然语言处理工具,1.7.5版本的发布进一步提升了其处理效率和效果,为Java开发者提供了强大的NLP支持,无论是在学术研究还是在实际产品开发中,都能发挥重要的作用。通过学习和使用...

    Android-HanLP是由一系列用于自然语言处理模型与算法组成的Java工具包

    HanLP,作为一款由Java编写的高效自然语言处理工具包,为Android开发者提供了丰富的NLP模型和算法,使其能够在移动设备上轻松实现复杂文本处理任务。 HanLP的主要特点: 1. 功能完善:HanLP涵盖了词性标注、分词、...

    基于HanLP自然语言处理包的elasticsearch分词器.zip

    在本项目中,我们主要探讨的是如何利用HanLP自然语言处理包来构建一个自定义的Elasticsearch分词器。Elasticsearch是一个流行的开源搜索引擎,它广泛应用于大数据分析和信息检索。自然语言处理(NLP)是人工智能的一...

    hanlp-python_spiderpbl_ch11/11.5.py_自然语言处理入门_

    HanLP是由北京大学计算机科学技术研究所开发的自然语言处理库,提供了分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富的功能,是NLP领域广泛使用的工具之一。 在学习和使用Python进行NLP时,通常...

    HanLP-data.zip

    自然语言处理(Natural Language Processing, NLP)是一项核心技能,而HanLP(全称:High-performance Natural Language Processing)是由国内知名NLP研究团队开发的一款高效、易用的Java库,专为中文处理而设计。...

    自然语言处理入门代码

    hanlp上相关代码文件面向生产环境的多语种自然语言处理工具包,基于 TensorFlow 2.x,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。目前,基于深度学习的...

    HanLp数据字典(1.7.1)

    而“HanLP”是Java语言中一款高效、易用的自然语言处理工具包,为开发者提供了丰富的文本分析功能。本文将深入探讨 HanLP 1.7.1 版本中的数据字典,以及其在NLP应用中的关键作用。 首先,让我们了解 HanLP 的核心...

    中文近义词:聊天机器人,智能问答系统,自然语言处理工具包

    标题中的“聊天机器人”、“智能问答系统”以及“自然语言处理工具包”是本文要讨论的核心概念,它们都是人工智能领域中的重要组成部分,特别是在中文信息处理方面。这些技术的发展极大地推动了人机交互的进步,使得...

    eclipse上配置hanlp完整包 已安装成功

    HanLP是一款强大的自然语言处理工具,由Java编写,适用于中文分词、词性标注、命名实体识别、依存句法分析等多种任务。以下是对配置过程的详细步骤及知识点的解析: 首先,你需要下载HanLP的完整包,其中包含了`...

    hanlp 1.7.7.zip

    在Java开发领域,自然语言处理(NLP)是一项重要的技术,而HanLP(由哈工大讯飞联合创始人韩松开发)作为一款优秀的开源Java NLP库,为开发者提供了丰富的中文处理功能,如分词、词性标注、命名实体识别等。...

Global site tag (gtag.js) - Google Analytics