`

Java分布式中文分词组件word分词v1.2发布

阅读更多

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。

 

自1.0之后,在1.1和1.2中,word分词有了重大改进,优化了分词算法、利用多线程提升分词速度、支持分布式、支持资源变化自动检测、新增了全切分算法、支持三元模型、支持Luke插件、增加gradle支持等等,同时,word1.2支持最新的ElasticSearch1.5.1、Lucene4.10.4、Solr4.10.4以及Luke4.0。

 

更多细节请查看:word分词主页

 

word分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

 

 

 

1
2
分享到:
评论

相关推荐

    word:Java分布式中文分词组件 - word分词

    Java分布式中文分词组件 - word分词 word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名...

    stopword:引用ysc备分

    ###Java分布式中文分词组件 - word分词####word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名...

    java开源包4

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包101

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包6

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包9

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包8

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包10

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包5

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包1

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包3

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    Java资源包01

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包2

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包11

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    java开源包7

    R-OSGi 是一套适用于任意满足 OSGi 架构的分布式通讯组件。它以 jar 的形式发布,部署容易,使用也较为便捷。 Java邮箱地址验证 jaev jaev 是一个用来验证电子邮箱地址是否有效的 Java 项目。 Java的FastCGI网关 ...

    elasticsearch-analysis-ik-8.1.3.zip

    Elasticsearch-analysis-ik插件是Elasticsearch中的关键组件,尤其对于中文全文搜索来说。了解并熟练掌握IK分词器的配置和使用,能够显著提升中文文本检索的准确性和效率。同时,结合SpringData-elasticsearch,可以...

    elasticsearch-analysis-ik-5.4.0

    4. **commons-logging-1.2.jar**:Apache Commons Logging库是一个轻量级的日志接口,它允许用户更换不同的日志实现,如Log4j或Java内置的日志框架。 5. **elasticsearch-analysis-ik-5.4.0.jar**:这是IK分词器的...

    elasticsearch-analysis-ik-1.10.6.zip

    7. config:这个目录很可能包含了IK分词器的配置文件,如ik_max_word和ik_smart等不同的分词模式设置,用户可以根据需求调整这些配置以优化分词效果。 在实际应用中,安装这个插件通常涉及到下载zip文件,然后将其...

    解密搜索引擎技术实战:Lucene&Java精华版

    ### 解密搜索引擎技术实战:Lucene&Java精华版 #### 搜索引擎基础知识及工作原理 本书开篇便从搜索引擎的基本概念入手,详细介绍了搜索引擎的工作原理和技术框架。在**第1章**“搜索引擎总体结构”中,作者从搜索...

    最新版 elasticsearch-analysis-ik-7.8.1.zip

    Elasticsearch Analysis IK 是一个为 Elasticsearch 设计的中文分词插件,它的最新版本是 7.8.1。这个插件的主要目的是提高中文文本在 Elasticsearch 中的搜索和分析性能。Elasticsearch 是一个广泛使用的开源全文...

Global site tag (gtag.js) - Google Analytics