`

jcseg的重新加载新词未能在ES中生效

 
阅读更多

由于当前业务比较依赖于词库精准匹配,且词库会根据业务来时时更新维护。所以选择了Jcseg词库。

但是在使用中确发现,新词虽然刷新至词库中,但是未被ES识别到。

查阅相关资料,发现有很多人都遇到过同样的问题。之后了解到需要将ADictionary的方法改为单例模式。可解决此问题。(可通过http://git.oschina.net/lionsoul/jcseg了解最新ES+jcseg最新调整)

 

由于git上的版本交高,而本地版本偏低。所以权衡之后,还是采用修改本地源码,之后再打jar包来解决此问题。在打包的过程中还碰到依赖lucene版本包的问题,此问题一度绕了好久。

 

所以最后总结相关经验,后续再碰到相关问题。一定是要依赖包和当前修改的版本要一致。

 

上传下基于elasticsearch-1.7.3+jcseg1.9.6的打成的jcseg-core-1.9.6.jar包。实现了ADictionary的单例模式。

分享到:
评论

相关推荐

    jcseg 中文分词插件

    在标题中提到的“jcseg中文分词插件”,指的是jcseg已经被封装为一个可插入到特定系统或平台中的组件,便于集成到各种应用中,特别是那些基于Elasticsearch构建的搜索或分析系统。Elasticsearch是一种强大的分布式...

    elasticsearch-jieba-plugin 8.8.2.zip

    完成这一步后,重启Elasticsearch服务,插件就会自动加载并生效。值得注意的是,在安装前,确保你的Elasticsearch版本与插件版本匹配,以免出现兼容性问题。 在使用`elasticsearch-jieba-plugin`时,你需要配置...

    Jcseg中文分词器 v2.6.3.zip

    在本文中,我们将深入探讨Jcseg分词器的主要功能、原理以及其在IT领域的应用。 Jcseg(Java Chinese Segmenter)是一个高效的开源中文分词组件,它主要由Java编写,因此适用于各种Java平台的项目。中文分词是自然...

    ElasticSearch 重写IK分词器源码设置mysql热词更新词库1

    5. **重启服务**:完成更新后,需要重启Elasticsearch服务以使新词库生效。 通过以上步骤,你可以实现一个动态更新的热词库系统,从而提高Elasticsearch的分词效率和准确性,特别是在处理实时数据和热点事件时,...

    jcseg-1.9.4-src-jar-dict.zip

    在《jcseg-1.9.4-src-jar-dict.zip》中,"src"目录包含了jcseg的源代码,开发者可以深入理解其内部机制,并根据需要进行定制和扩展。源代码通常分为以下几个部分: 1. **jcseg-core**:核心分词模块,实现了基本的...

    elasticsearch-analysis-ik-7.4.0 ik分词器7.4.0

    在 Elasticsearch 的配置文件 `elasticsearch.yml` 中,需要添加或修改以下配置项来启用 IK 分词器: ```yaml analysis: analyzer: my_analyzer: # 定义自定义分析器 type: ik_max_word # 使用IK分词器的全模式 ...

    ansj elasticsearch 独立分词插件

    **正文** 在中文文本处理领域,分词是至关重要的一步,因为它直接影响到后续的搜索、分析和信息提取等任务的准确性。...正确配置和使用这个插件,能够显著提升中文文本在Elasticsearch中的搜索体验和数据分析效果。

    (源码)基于Elasticsearch和IK分词器的热更新中文分词系统.zip

    通过修改IK分词器源码,实现了从MySQL数据库中自动加载新词库的功能,支持Elasticsearch集群的热更新,无需重启节点即可实时加载新词。 ## 项目的主要特性和功能 1. 热更新功能支持从MySQL数据库中自动加载新词库...

    elasticsearch-7.0.0 版本 ik 中文分词器

    要在 Elasticsearch 7.0.0 中使用 IK 分词器,首先需要将分词器的插件包下载并安装到 Elasticsearch 的 plugins 目录下。在提供的压缩包中,包含了编译好的 IK 插件,可以直接使用,无需自行编译。 2. **配置IK...

    elasticsearch-analysis-ik-1.2.6

    1. 在Elasticsearch的配置文件`elasticsearch.yml`中添加IK分词器的相关设置,如指定词典路径等。 2. 创建索引时,指定使用IK分词器。例如,在`settings`部分写入: ``` analysis: analyzer: my_analyzer: type...

    elasticsearch-analysis-dynamic-synonym-7.6.2

    总的来说,`elasticsearch-analysis-dynamic-synonym-7.6.2`插件是ES7.6.2版本中实现动态同义词功能的重要工具,它通过高效的数据处理和灵活的API,让同义词管理变得更加便捷,极大地提升了ES在实际业务中的应用效果...

    elasticsearch-7.4.2

    - 在Elasticsearch中集成jieba,可以提升对中文文本的理解和检索性能。 5. **安装与配置:** - 下载解压`elasticsearch-7.4.2`后,你需要根据自己的需求配置`elasticsearch.yml`配置文件,例如设置节点名称、集群...

    elasticsearch7.8.0版本的IK分词器

    3. **动态词典加载**: 在运行时,IK 分词器支持动态加载和更新词典,无需重启服务即可生效,这在应对词汇变化快速的环境中有很大优势。 4. **智能分析**: IK 分词器内置了基于词频的智能分析算法,可以根据词频自动...

    jcseg-core-1.9.7.jar

    1. 词库优化:增加新词,去掉一些无用词,部分词条词性优化。 2. 增加文章关键字提取:基于textRank算法。 3. 增加文章关键短语提取:基于textRank算法。 4. 增加文章关键句子/文章摘要提取:基于BM25+textRank...

    Elasticsearch.zip 包含 elasticsearch、elasticsearch-analysis-ik、es-head、kibana

    4. **Kibana**: Kibana是Elasticsearch的数据可视化工具,用于展示和交互式分析存储在Elasticsearch中的数据。它可以创建各种图表、仪表盘,帮助用户理解数据趋势和模式。Kibana也提供了强大的搜索和过滤功能,以及...

    elasticsearch-analysis-ik-1.3.0.zip

    IK 分词器在 Elasticsearch 社区中有着广泛的应用,尤其对于需要进行中文搜索和分析的项目来说,它是不可或缺的一部分。 1. **Elasticsearch 简介** Elasticsearch 是一个开源的全文搜索引擎,基于 Lucene 库构建...

    elasticsearch-analysis-ansj-5.2.2.0-release.zip

    在ES的配置文件(如elasticsearch.yml)中,可以配置Ansj分析器,如: ```yaml analysis: analyzer: my_analyzer: type: org.ansj.elasticsearch.AnalysisANSJAnalyzer ``` 4. **使用与调优** 在索引文档时,...

    elasticsearch-analysis-ik-6.4.2 插件包含源码

    此插件在 Elasticsearch 中的作用是提供高效的中文分析能力,它支持多种分词模式,能够适应不同的应用场景,如搜索引擎、数据分析等。 "elasticsearch-analysis-ik" 插件的主要特点包括: 1. **智能分词**:IK ...

    Elasticsearch-6.3.2(Linux+Win)+中文分词ik-6.3.2.zip

    在本压缩包中,我们拥有Elasticsearch的6.3.2版本,这是一个稳定且广泛使用的版本,包含了适用于Linux和Windows两个操作系统平台的安装包。这使得无论您在哪个操作系统上工作,都可以轻松地部署和运行Elasticsearch...

    最新版 elasticsearch-analysis-ik-7.7.0.zip

    在Elasticsearch中,正确的分词对于搜索和分析中文文本至关重要,因为搜索引擎基于这些分词来理解并处理查询。 Elasticsearch本身支持多种语言,但默认的分析器主要针对英文。对于中文,就需要安装额外的插件如IK...

Global site tag (gtag.js) - Google Analytics