`

HanLP - 汉语言处理包

 
阅读更多
HanLP - 汉语言处理包

HanLP v1.2.8的特征:

最高分词速度2,000万字/秒(极速分词,2.0GHz i7)
35万词典,覆盖现代汉语常用词、网络新词等
337万接续BiGram文法模型
500 ms 词典加载
训练自2014年人民日报切分语料
词语标注集兼容《ICTPOS3.0汉语词性标记集》
词语标注集兼容《现代汉语语料库加工规范——词语切分与词性标注》
最低内存要求120 MB(-Xms120m -Xmx120m -Xmn64m)
基于双数组Trie的AhoCorasick自动机算法实现O(n)多模式匹配
运行于Java6+
提供Lucene插件,兼容Lucene4.x
Apache License Version 2.0
HanLP产品初始知识产权归上海林原信息科技有限公司所有,任何人和企业可以无偿使用,可以对产品、源代码进行任何形式的修改, 可以打包在其他产品中进行销售。任何使用了HanLP的全部或部分功能、词典、模型的项目、产品或文章等形式的成果必须显式注明HanLP及此项目主页。
分享到:
评论

相关推荐

    Hanlp最新版本V1.7.2(含hanlp-1.7.2.jar、模型data包、配置文件hanlp.properties)

    汉语言处理库HanLP是Java实现的自然语言处理(NLP)工具,广泛应用于文本分析、信息提取、情感分析等领域。最新版本V1.7.2包含了一系列优化和新功能,使得它在处理汉语文本时更为高效和准确。这次发布的压缩包提供了...

    Hanlp分词实现从网络片段中提取省份和城市

    HanLP是由科大讯飞开发的一款高性能的自然语言处理工具包,它提供了丰富的中文分词、词性标注、命名实体识别等功能。 首先,我们需要理解如何使用HanLP进行分词。HanLP的核心是基于统计的分词模型,它能够将输入的...

    elasticsearch-analysis-hanlp-7.1.1.zip

    Elasticsearch Analysis HanLP插件是基于汉语言处理库HanLP(由北京大学计算机科学技术研究所开发)的扩展,它为Elasticsearch提供了高性能的中文分词能力。HanLP具备准确、快速的特点,同时支持词语的多种切分方式...

    hanlp-1.7.4-release.zip

    汉语言处理工具包 HanLP,版本1.7.4,是一个专门为中文文本处理设计的Java库,致力于在实际生产环境中推动自然语言处理技术的应用。HanLP以其全面的功能、高效的性能、简洁的架构、及时更新的语料库以及高度可定制化...

    eclipse上配置hanlp完整包 已安装成功

    在本文中,我们将深入探讨如何在Eclipse IDE中配置并成功使用HanLP(汉语言处理库)1.2.8版本。HanLP是一款强大的自然语言处理工具,由Java编写,适用于中文分词、词性标注、命名实体识别、依存句法分析等多种任务。...

    HanLP相关jar包与配置文件

    汉语言处理(HanLP)是Java开发的一个自然语言处理库,由科大讯飞研发,广泛应用于搜索引擎、智能问答、信息抽取、机器翻译等领域。在IT行业中,掌握HanLP可以帮助我们处理中文文本,进行词性标注、命名实体识别、...

    Python-自然语言处理工具包HanLP的Python接口

    **Python-自然语言处理工具包HanLP的Python接口** 在Python的世界里,自然语言处理(NLP)是一项关键任务,涉及文本分析、语义理解、情感分析等多个领域。HanLP,由厦门汉云科技有限公司开发,是一款高效、易用的...

    典型相关分析matlab实现代码-HanLP-1.5.4:汉LP-1.5.4

    汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 最短路...

    典型相关分析matlab实现代码-HanLP:汉语言处理包

    汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供...

    汉语言处理包

    HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可...

    基于Python和Java语言的汉语言处理工具HanLP设计源码

    该项目为基于Python和Java语言的汉语言处理工具HanLP的设计源码,总计包含588个文件,其中Python文件419个,Markdown文件146个,reStructuredText文件8个,Java文件6个,YAML文件2个,Python扩展文件2个,Git忽略...

    典型相关分析matlab实现代码-HanLP-1.2.4-Taikor:HanLp-1.2.4Tyk叉

    汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 最短路...

    典型相关分析matlab实现代码-HanLP:汉语言处理

    汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 最短路...

    hanlp在Python环境中的安装

    汉语言处理库(HanLP)在Python环境中的安装是一个关键步骤,对于那些希望在Python项目中利用自然语言处理技术的开发者来说尤其重要。HanLP,全称“Harvard NLP Library”,是由Java编写的,提供了丰富的自然语言...

    典型相关分析matlab实现代码-HanLP:汉语言处理,Java版本

    汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍...

    典型相关分析matlab实现代码-hanlp-kong:汉岗

    汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍...

    hanlp jar ,最近搞分词技术把不同版本的jar 提供给大家

    汉语言处理(HanLP)是Java开发的一个开源的自然语言处理工具包,由北京大学计算机科学技术研究所和科大讯飞联合研发。它提供了丰富的NLP功能,包括但不限于分词、词性标注、命名实体识别、依存句法分析、关键词抽取...

    典型相关分析matlab实现代码-HanLP-master:汉普大师

    汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-...

    matlab导入excel代码-NLP-HanLP:汉语言考试

    汉语言处理包 HanLP是由一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-...

    matlab信息熵代码-HanLP-master:一个人工智能的框架

    汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 最短路...

Global site tag (gtag.js) - Google Analytics