`

自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》

 
阅读更多

 

12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。



 

图:大快搜索获评“2018中国大数据基础软件领域领军企业”

在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领中国大数据产业发展的创新技术》。在本书的第一章节收录介绍了大快搜索自主研发的Hanlp技术。



 

图:数据之翼-引领中国大数据产业发展的创新技术

Hanlp是由大快搜索高级研究员何晗主导开发的完全开源的项目,具有精度高、速度快、内存省的特点。

2014年,还在攻读日语本科的何晗(大快搜索高级研究员)一定没想到,机缘巧合研发的一款中文分词器,在随后几年中几经迭代,并在商用市场大放异彩。

而看似是“无心插柳柳成荫”的事情,却凝聚着何晗对Hanlp工匠式的锤炼。

Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理(NLP)在生产环境中的应用。Hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点:能够提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。

 

  • 大小: 297.3 KB
  • 大小: 316.5 KB
分享到:
评论

相关推荐

    HanLP自然语言处理

    HanLP,全称为“哈工大讯飞自然语言处理工具包”,是由一系列先进的模型和算法构建的Java库,旨在推动NLP技术在实际生产环境中的广泛应用。本文将深入探讨HanLP的功能、特性以及其在分词领域的应用。 首先,HanLP的...

    hanlp 自然语言处理入门

    在"hanlp 自然语言处理入门"的学习资料中,我们可以期待涵盖一系列基础到进阶的NLP概念和技术。这里我们将深入探讨其中的关键知识点。 首先,Python-3.8.10-amd64.exe是一个Python编程环境的安装程序,Python是NLP...

    基于Python和Java语言的汉语言处理工具HanLP设计源码

    该项目为基于Python和Java语言的汉语言处理工具HanLP的设计源码,总计包含588个文件,其中Python文件419个,Markdown文件146个,reStructuredText文件8个,Java文件6个,YAML文件2个,Python扩展文件2个,Git忽略...

    Python-自然语言处理工具包HanLP的Python接口

    **Python-自然语言处理工具包HanLP的Python接口** 在Python的世界里,自然语言处理(NLP)是一项关键任务,涉及文本分析、语义理解、情感分析等多个领域。HanLP,由厦门汉云科技有限公司开发,是一款高效、易用的...

    基于Python和Java的HanLP自然语言处理工具设计源码

    该项目是一个基于Python和Java的HanLP自然语言处理工具设计源码,总共有593个文件,其中包括422个Python源文件、146个Markdown文档、8个ReStructuredText文件、8个Java源文件、2个YAML配置文件、2个Python扩展文件、...

    hanlp-python_spiderpbl_ch11/11.5.py_自然语言处理入门_

    HanLP是由北京大学计算机科学技术研究所开发的自然语言处理库,提供了分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富的功能,是NLP领域广泛使用的工具之一。 在学习和使用Python进行NLP时,通常...

    基于HanLP自然语言处理包的elasticsearch分词器.zip

    总的来说,这个基于HanLP的Elasticsearch分词器项目是一个很好的学习资源,它展示了如何将先进的自然语言处理技术融入大数据搜索引擎中,以提升信息检索的准确性和效率。对于大二学生来说,这不仅是一个理论与实践相...

    HanLp数据字典(1.7.1)

    《汉Lp数据字典(1.7.1)——深度探索自然语言处理的世界》 ...然而,掌握和应用这些工具的同时,也需要对自然语言处理的理论和技术有深入的理解,以便更好地利用和优化HanLP,推动NLP技术的进步。

    自然语言处理 NLP HANLP data-for-1.7.5.zip data-for-1.8.4.rar 训练模型

    概要:HANLP 1.x 数据包兼容data-for-1.7.5.zip ...场景:NLP 自然语言处理 HANLP 训练模型 CRF perceptron model 下载 cws.txt.bin ner.txt.bin pos.txt.bin cws.bin ner.bin pos.bin NNParserModel.txt.bin

    Android-HanLP是由一系列用于自然语言处理模型与算法组成的Java工具包

    HanLP,作为一款由Java编写的高效自然语言处理工具包,为Android开发者提供了丰富的NLP模型和算法,使其能够在移动设备上轻松实现复杂文本处理任务。 HanLP的主要特点: 1. 功能完善:HanLP涵盖了词性标注、分词、...

    基于Python和Java的HanLP自然语言处理设计源码

    该源码涵盖了中文分词、词性标注、命名实体识别、依存句法分析、语义依存分析、新词发现、关键词短语提取、自动摘要、文本分类聚类、拼音简繁转换等自然语言处理技术,适用于各种自然语言处理相关应用。

    自然语言处理入门代码

    hanlp上相关代码文件面向生产环境的多语种自然语言处理工具包,基于 TensorFlow 2.x,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。目前,基于深度学习的...

    基于HanLP自然语言处理包的elasticsearch分词器 hanlp-tokenizer-master

    基于HanLP自然语言处理包的elasticsearch分词器 功能 本分词器使用HanLP提供的维特比分词 屏蔽了本地配置用户词典 增加同义词索引功能 增加远程词典热更新(用户词典,停词典,同义词典) 使用 目前支持的es版本为...

    中文近义词:聊天机器人,智能问答系统,自然语言处理工具包

    标题中的“聊天机器人”、“智能问答系统”以及“自然语言处理工具包”...随着深度学习和大数据的不断发展,聊天机器人、智能问答系统以及自然语言处理工具包的性能将会持续提升,未来在更多场景下为人类生活带来便利。

    基于Python的HanLP中文自然语言处理设计源码

    本项目为基于Python开发的HanLP中文自然语言处理源码,总文件量达198个,涵盖192个Python源文件、3个Markdown文档、1个YAML配置文件、1个Git忽略文件以及1个LICENSE文件。该源码集成了丰富的自然语言处理功能,包括...

    自然语言处理,推荐系统答辩PPT.pptx

    在利用TF-IDF和simhash算法解决信息检索和专家匹配问题的基础上,未来的研究还可以进一步探索如何更好地利用自然语言处理技术,以优化推荐算法,应对大数据环境下的信息处理需求。这不仅能够提升科研项目需求管理...

    基于Python和Java的HanLP中文自然语言处理设计源码

    该项目是一个基于Python和Java的HanLP中文自然语言处理设计源码,包含614个文件,涵盖442个Python脚本、149个Markdown文档、8个reStructuredText文件、8个Java源文件、2个YAML配置文件、1个Git忽略文件、1个许可证...

    基于Python和Java的hanLP自然语言处理设计源码

    本项目为hanLP自然语言处理框架的设计源码,主要采用Python编写,辅以Java进行跨平台开发。项目文件共计660个,其中包括475个Python源文件、157个Markdown文档、13个Java源文件、8个reStructuredText文件、2个YAML...

    HanLp数据字典(1.3.3)

    汉语言处理(HanLP)是由Conll2005、Conll2006、SIGHAN2005等多个国际评测冠军团队打造的一款高效、易用、功能丰富的自然语言处理工具包,主要由Java编写,同时提供了Python接口。本资源“HanLP数据字典(1.3.3)”...

    自然语言处理入门学习.pdf

    如果是刚刚开始学习复现一些算法,当然从基础的方向和算法开始吧,因为这些算法都是实现更复杂网络的“砖”,这些“砖”包括CNN,Word Embeeding、LSTM、Seq2Seq+Attention、Language Model。从去年开始大火的...

Global site tag (gtag.js) - Google Analytics