`

中文分词elasticsearch-analysis-ik

 
阅读更多

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。

从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。

IK Analyzer 2012特性:

1.采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式;

2.在系统环境:Core2 i7 3.4G双核,4G内存,window 7 64位, Sun JDK 1.6_29 64位 普通pc环境测试,IK2012具有160万字/秒(3000KB/S)的高速处理能力。

3.2012版本的智能分词模式支持简单的分词排歧义处理和数量词合并输出。

4.采用了多子处理器分析模式,支持:英文字母、数字、中文词汇等分词处理,兼容韩文、日文字符

 

5.优化的词典存储,更小的内存占用。支持用户词典扩展定义。特别的,在2012版本,词典支持中文,英文,数字混合词语。

elasticsearch-analysis-ik将Ik Analyzer作为插件集成到了elasticsearch。

elasticsearch-analysis-ik的安装细节请参考github上的原文。

 

链接:IK Analyzer官网

           IK Analyzer的Maven代码链接

           elasticsearch-analysis-ik的github链接

        

分享到:
评论

相关推荐

    7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器

    elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点: 中文分词:elasticsearch-analysis-ik 是基于...

    elasticsearch-analysis-ik 7.10.0 分词器

    Elasticsearch-analysis-ik 是一个专为 Elasticsearch 设计的中文分词插件,它基于 Lucene 的 IK 分词器,旨在提供高效、准确的中文分词能力。 **IK 分词器介绍** IK (Intelligent Chinese Analyzer) 是一个针对...

    ES IK分词器插件elasticsearch-analysis-ik-7.8.0

    ES IK分词器插件elasticsearch-analysis-ik-7.8.0

    IK分词器8.15.0 elasticsearch-analysis-ik-8.15.0.zip

    IK分词器8.15.0版本 elasticsearch-analysis-ik-8.15.0.zip 适用于中文文本分析

    最新版 elasticsearch-analysis-ik-8.7.0.zip

    最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip最新版 elasticsearch-analysis-ik-8.7.0.zip

    elasticsearch-analysis-ik-7.10.2.zip

    《Elasticsearch中文分词器:elasticsearch-analysis-ik-7.10.2》 在信息技术领域,数据处理和搜索效能是至关重要的。Elasticsearch(ES)作为一个开源的全文搜索引擎,因其强大的搜索功能和分布式特性而备受青睐。...

    elasticsearch-analysis-ik-7.16.3.zip

    Elasticsearch的IK分词器为中文全文检索提供了强大的支持,通过"elasticsearch-analysis-ik-7.16.3.zip"插件的安装和配置,我们可以轻松地在Elasticsearch中实现对中文文本的高效分词。无论是日志分析、内容推荐还是...

    最新版elasticsearch-analysis-ik-8.8.1.zip

    最新版elasticsearch-analysis-ik-8.8.1.zip最新版elasticsearch-analysis-ik-8.8.1.zip最新版elasticsearch-analysis-ik-8.8.1.zip最新版elasticsearch-analysis-ik-8.8.1.zip

    elasticsearch-analysis-ik-7.10.0.zip下载

    "elasticsearch-analysis-ik"是针对Elasticsearch的一个中文分词插件,它的主要功能是提供高效、精准的中文分词能力,使得Elasticsearch能够更好地理解和处理中文文本数据。 在Elasticsearch 7.10.0版本中,...

    windows版本ES7.17.3中文分词器elasticsearch-analysis-ik-7.17.3 .zip

    用于elasticsearch7.17.3这个版本的ik中文分词器,考虑到官网有时网络不稳定下载不下来,这里特意上传,方便大家使用; 目录结构如下: config -- 文件夹 plugin-security.policy plugin-descriptor.properties ...

    elasticsearch-analysis-ik-7.3.2.zip

    "elasticsearch-analysis-ik"是ES中最受欢迎的中文分词器之一,专为提升中文文本分析性能而设计。本文将深入探讨"elasticsearch-analysis-ik-7.3.2"这个版本,以及与其相关的技术细节。 首先,"elasticsearch-...

    elasticsearch-analysis-ik-7.7.0

    Elasticsearch 分析插件 `elasticsearch-analysis-ik` 是一个专门为 Elasticsearch 设计的中文分词器,其7.7.0版本是针对 Elasticsearch 7.7.0 版本优化的。这个插件的主要作用在于对中文文本进行智能分析,将其拆分...

    elasticsearch-analysis-ik-7.4.2.zip.7z

    《Elasticsearch中文分词插件:elasticsearch-analysis-ik-7.4.2》 在深入探讨Elasticsearch的中文分词插件elasticsearch-analysis-ik-7.4.2之前,首先需要理解Elasticsearch的基础知识。Elasticsearch是一款高性能...

    最新版elasticsearch-analysis-ik-8.8.2.zip

    最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip最新版elasticsearch-analysis-ik-8.8.2.zip

    elasticsearch-analysis-ik-7.16.2.zip

    elasticsearch-analysis-ik是针对Elasticsearch的中文分词插件,旨在提供高效、精确的中文分词能力。版本7.16.2是针对Elasticsearch 7.16.2的优化版本,能够与该版本的Elasticsearch无缝集成。IK分词器具有丰富的...

    elasticsearch-analysis-pinyin-7.10.1 elasticsearch-analysis-ik-7

    IK(Intelligent Chinese)是Elasticsearch中非常流行的一个中文分词插件,其主要任务是对中文文本进行分词,以便更准确地进行索引和搜索。IK分词器具有以下特点: - **丰富的词库**:内置了大量的词汇和短语,覆盖...

    最新版 elasticsearch-analysis-ik-7.9.3.zip

    最新版的`elasticsearch-analysis-ik-7.9.3.zip`正是针对Elasticsearch 7.9.3版本定制的中文分词插件,旨在优化中文文本的检索和分析性能。 `elasticsearch-analysis-ik`插件的核心功能是提供中文分词服务,它基于...

    最新版 elasticsearch-analysis-ik-7.6.2.zip

    "elasticsearch-analysis-ik-7.6.2.zip" 是针对Elasticsearch 7.6.2版本的一个专门用于中文分词的插件,其目的是优化对中文文本的索引和查询性能。 IK分析器是Elasticsearch社区中非常流行的一个中文分词插件,由...

    elasticsearch-analysis-ik-5.6.8 ik分词器插件

    首先,"elasticsearch-analysis-ik"是专为Elasticsearch设计的中文分词器,它能够有效地对中文文本进行分词,提高中文搜索的准确性和效率。5.6.8版本是该插件的一个稳定版本,与Elasticsearch 5.6.x系列兼容,确保了...

    elasticsearch-analysis-ik-6.8.0.zip

    Elasticsearch 分析...总的来说,"elasticsearch-analysis-ik-6.8.0.zip" 提供了一个方便的解决方案,使得开发者和运维人员在国内环境下也能轻松获取和安装 IK 分词器,从而优化 Elasticsearch 的中文文本处理能力。

Global site tag (gtag.js) - Google Analytics