`

Hanlp1.7版本的新增功能一览

阅读更多

 

Hanlp1.7版本在去年下半年的时候就随大快的DKH1.6版本同时发布了,截至目前1.7大版本也更新到了1.7.1了。本篇分别就1.7.0和1.7.1中新增的功能做一个简单的汇总介绍。



 

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。

1.7.0更新如下:

新增文本聚类模块(k-means和repeated bisection)

词法分析器新增流水线模式

词法分析器加入规则 enableRuleBasedSegment #991

支持通过 JVM 的启动参数指定 data 路径:java -DHANLP_ROOT=/opt/hanlp 则加载/opt/hanlp/data #983

分词断句支持指定断句颗粒 #1018

CustomDictionary.insert("新词语", "词性标签") 支持省略频次

NeuralNetworkDependencyParser 构造函数接受 Segment

TextRankKeyword 支持构造自任意分词器

优化双数组 trie 树,构建后自动 shrink 到最低内存 #984

修订简繁词典

微调 ngram 和 nr 模型

新数据包 data-for-1.7.0.zip MD5 = 4c396f3039230ddfcef20865264512b1

Portable 版同步升级到 v1.7.0

HanLP v1.7.1 更新内容:

新增可自定义用户词典的维特比分词器 @AnyListen

利用 BufferedOutputStream 加速缓存生成,快37倍

自定义词典兼容含有空格的路径,fix #1025

增加 isCustomNature 方法

使热更新产生的缓存文件包含用户词性,fix #1028

修复可变 DAT 的 entrySet 方法,fix #1038

微调 ngram,简繁等

新数据包 data-for-1.7.1.zip MD5 = 9b8faa7fc7fddb24e27da27bd404126d

Portable 版同步升级到 v1.7.1

  • 大小: 585.6 KB
分享到:
评论

相关推荐

    hanlp1.7jar包下载

    标题“hanlp1.7jar包下载”表明我们要讨论的是HanLP的1.7版本的Java库,通常以.jar格式提供,方便Java开发者在项目中引入和使用。 HanLP 1.7.0是其历史版本之一,可能包含了一些特定的功能改进和优化。虽然没有具体...

    EV5000组态软件V1.7版本新增功能说明

    EV5000组态软件是专为步科触摸屏设计的一款强大而直观的编程工具,其V1.7...用户可以通过阅读“EV5000组态软件V1.7版本新增功能说明20121130.pdf”文件,获取详细的操作指南和实例演示,全面了解这些新特性的具体应用。

    Win32SVN 1.7版本

    在1.7版本中,Subversion引入了几个重要的新特性: 1. **工作副本格式升级**:1.7版本的工作副本格式进行了重大改动,提高了文件和目录的访问速度,降低了磁盘空间的占用。 2. **数据库优化**:对内部数据库(.svn...

    64位svn1.7版本

    2. **SVN-1.7.10** - 这是Subversion的一个具体版本号,1.7系列是一个较旧但稳定版本,提供了许多基本的版本控制功能。 3. **svn1.764位** - 同样指Subversion 1.7系列的64位版本。 4. **svn汉化** - 表示用户可能...

    Maven兼容jdk1.7版本

    【标题】"Maven兼容jdk1.7版本"指出的核心知识点是关于Apache Maven的一个特定版本——3.0.5,这个版本与Java Development Kit (JDK) 1.7(也称为Java 7)有着良好的兼容性。在软件开发过程中,构建工具如Maven与...

    jdk1.7版本window64位

    JDK1.7,也被称为Java SE 7(Java Standard Edition 7),是Oracle公司在2011年推出的Java版本。这个版本在Java平台上引入了许多新特性、改进和优化,对于Windows 64位操作系统,它提供了一个兼容性和性能良好的开发...

    Java开发JDK1.7版本

    Java jdk1.7版本..........................................................................................................................................................

    jdk1.7版本免安装

    Java Development Kit (JDK) 是Java编程语言的核心组件,它为开发者提供了编译、调试和运行Java应用程序所需的所有工具。...如果你需要使用特定功能或与旧项目保持兼容,JDK 1.7是一个值得考虑的选择。

    JDK64位1.7版本

    JDK1.7 64位版本,亲测可用,使用方便!使用时直接解压安装即可

    睿智FPGA开发板用户手册1.7版本最新

    睿智FPGA开发板用户手册1.7版本最新

    jdk1.7版本-----------

    JDK 1.7,也被称为Java SE 7(Java Standard Edition 7),是Oracle公司在2011年发布的一个重要版本,对Java平台进行了多项改进和增强。 首先,JDK 1.7引入了类型推断,这在Java编程中极大地简化了泛型的使用。...

    TortoiseSVN-1.7最新版本(32位和64位都有)

    - 1.7系列是TortoiseSVN的一个稳定版本,但随着时间推移,可能会有安全漏洞或新功能的发布,因此建议定期检查更新以保持最佳性能和安全性。 - 使用TortoiseSVN的更新功能可以便捷地将本地仓库与远程仓库同步,获取...

    jdk1.7 版本 64位 jdk1.7的下载

    本文将深入探讨JDK1.7版本,特别是64位的版本,这对于理解和使用Java编程语言至关重要。 JDK1.7,也被称为Java SE 7(Java Platform, Standard Edition 7),是Oracle公司于2011年发布的一个重要更新。这个版本引入...

    PV3D源码包(1.5版本和1.7版本)

    1.5到1.7版本的升级主要关注性能优化、新功能添加以及API的改进。其中,渲染引擎是关键,它负责将3D对象转化为2D屏幕上的像素,包括视口设置、相机操作、光照处理等。 2. 3D对象模型 PV3D中的3D对象模型包括几何体...

    Java开发jdk1.7版本

    这个版本引入了许多新特性,旨在提高开发效率和代码质量。例如: 1. **多 Catch 语句**:在Java 7中,可以在一个try-catch块中捕获多个异常类型,减少了代码的冗余。 2. **钻石操作符**:对于匿名类型初始化,如`...

    java开发jwt认证 令牌,jwt.jar包 jwt 实现token认证,支持jdk1.7版本 java令牌

    jwt.jar包 jwt所需jar包集合 使用commons-codec.jar + java-jwt.jar进行token认证,支持jdk1.7及以上版本,目前大多数jwt支持至少需要1.8及以上,资源不好找,且行且珍惜。 如果需要源码以及功能实现方式,请联系...

    jdk1.7版本jar包下载

    **Java Development Kit (JDK) 1.7 版本详解** Java Development Kit,简称JDK,是Oracle公司提供的用于开发和运行Java应用程序的核心工具集。JDK 1.7,也被称为Java 7,是Java平台的一个重要版本,包含了Java...

    OgreXMLConverter工具 1.7版本

    1.7版本的发布,标志着这个工具在功能、性能和易用性上又向前迈进了一步,为开发者提供了更强大的资源管理能力,从而简化游戏开发流程。通过熟练掌握OgreXMLConverter的使用,开发者可以更加高效地整合和管理他们的...

    JavaJDK1.7最新版本

    JavaJDK1.7最新版本

    java jdk 1.7官网免安装版本

    - **NIO.2**:新增了文件系统API,提供了更好的文件操作功能,如异步I/O和文件属性查询。 - **钻石操作符**:在创建匿名类或使用泛型时,可以省略类型参数,如`new ArrayList();` - **尝试-with-resources语句**...

Global site tag (gtag.js) - Google Analytics