lucene 和 IKAnalyzer 的版本问题 - - ITeye博客

`

zlele

浏览: 38185 次
性别:

最近访客更多访客>>

fan0128

yuefeng1110

wjf0334

bluesky555

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

ayaome： ...
线程以及缓冲区
spiniper：乍一看，还以为是全文检索与索引的构建...原来只是文件名的递归 ...
文件搜索

lucene 和 IKAnalyzer 的版本问题

博客分类：

信息检索

阅读更多

因为听说lucene的自带分词对中文的支持不太好，，所以选择IKAnalyzer.效果确实比自带的好些。

配置中遇到一些版本问题。

<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-core</artifactId>
    <version>4.10.3</version>
</dependency>
<dependency>
    <groupId>com.janeluo</groupId>
    <artifactId>ikanalyzer</artifactId>
    <version>2012_u6</version>
</dependency>

这是我使用的版本，可作为参考。

在进行索引删除时，利用term删除，不报错但实际上并没有删除。后来查资料有说，lucene要用5.5版本的，设置，通过FieldType中的tokenized属性来控制的。然而，我换成5.5.0之后，和我的2012_u6版本有匹配不上了。。最后又改回去，查看其它删除索引的文章，最后发现，使用 document.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));是可以的。喜大普奔。

参考：http://zhh9106.iteye.com/blog/2036699

分享到：

kong lua | java调用tensorflow的pb模型的一些问题

2018-02-28 14:27
浏览 1846
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

模糊查询-lucene-IKAnalyzer: 本话题主要探讨的是在Java 1.5环境下，如何利用Lucene 3.0.1版本和IKAnalyzer 3.2来实现模糊查询的功能。Lucene是一个高性能、全文本搜索库，而IKAnalyzer是一个专门针对中文分词的开源分析器，它们的结合能够有效地...

org.wltea.analyzer.lucene.IKAnalyzer jar: solr的IK分词器JAR及配置文件 jar包和配置文件的放置位置不一样，详情可搜索 IK Analyzer 是一个开源的，基于java语言开发的轻量级的中文分词工具包。...org.wltea.analyzer.lucene.IKAnalyzer jar

IKAnalyzer 支持高版本最新Lucene 5.x、6.x、7.x: 在给定的标题和描述中，我们看到IKAnalyzer已经更新以支持Lucene的高版本，包括5.x、6.x以及最新的7.3.1版本，这表明它持续跟进了Lucene的发展，确保与主流搜索引擎框架的兼容性。 1. **IKAnalyzer详解**： - IK...

IKAnalyzer中文分词支持lucene6.5.0版本: 由于林良益先生在2012之后未对IKAnalyzer进行更新，后续lucene分词接口发生变化，导致不可使用，所以此jar包支持lucene6.0以上版本

lucene的IKAnalyzer以及兼容4.3: 本文将深入探讨IKAnalyzer的特性和其在Lucene 4.3中的兼容性问题及其解决方案。 **IKAnalyzer简介** IKAnalyzer（ Intelligent Keyword Analyzer）是一款基于Java实现的中文分词工具，它主要针对中文的特性进行了...

Lucene5.21+IkAnalyzer: 本文将详细介绍如何使用Lucene 5.21版本结合IkAnalyzer 2012_V5进行文本分析和全文搜索的入门实践。首先，让我们了解Lucene。Lucene是Apache软件基金会的一个开源项目，它是一个高性能、全文检索库，提供了强大的...

IKAnalyzer2012_FF_hf1.jar: 解决lucene4.0与IKAnalyzer的冲突。解决Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides final method tokenStream.(Ljava/lang/String;Ljava/io/Reader;...

lucene3.5 IKAnalyzer3.2.5 实例中文分词通过: lucene3.5 IKAnalyzer3.2.5 实例中文分词通过，目前在网上找的lucene 和IKAnalyzer 的最新版本测试通过。内含：示例代码，以及最新jar包。 lucene lucene3.5 IKAnalyzer IKAnalyzer3.2.5 jar 中文分词

lucene5和IKAnalyzer5的jar包相匹配: 首先，需要将IKAnalyzer5的jar包导入到项目的lib目录下，确保其与Lucene5的版本相匹配，避免出现类冲突或运行异常。然后，在Lucene的索引创建过程中，设置IKAnalyzer为默认的Analyzer，这样在建立索引时，文档中的...

Lucene的IK Analyzer 3.0 中文分词器全解: - 分词器能够准确识别并处理各种文本，例如在一段介绍IK Analyzer的文字中，它能够正确将“IKAnalyzer”拆分为“ik-analyzer”，同时处理日期、版本号等非标准格式的词汇。 - 在处理公司名称时，如“永和服装饰品...

IKAnalyzer6.5.0.jar: 4. **项目构建相关文件**：`.classpath` 和 `.project` 是Eclipse IDE的项目配置文件，它们包含了项目的依赖信息和构建设置，帮助开发者在IDE环境中正确导入和管理IKAnalyzer6.5.0.jar。 5. **库文件夹**：`libs` ...

lucene增删改查+IKAnalyzer: 总结，Lucene和IKAnalyzer的组合为我们提供了构建中文全文搜索引擎的强大工具。通过理解它们的工作原理和核心组件，我们可以灵活地应用于各种项目中，提升数据检索的效率和用户体验。在实际开发中，还需要考虑性能...

c# 中文分词 LUCENE IKAnalyzer: 标题中的"C# 中文分词 LUCENE IKAnalyzer"是指使用C#语言实现的一个中文分词工具，它基于开源全文检索引擎Lucene，并且采用了IKAnalyzer（智能汉字分词系统）的Java版本进行移植。Lucene是一个强大的、高性能的信息...

IKAnalyzer 支持高版本Lucene 6.x及以上: 来自牛人修改的IKAnalyzer，https://github.com/sea-boat/IKAnalyzer-Mirror，亲测Lucene7.2可用

中文分词库 IKAnalyzer For Lucene 5.2.1（适用Lucene 5.2.1）: 这个版本的 IKAnalyzer 特别适用于 Lucene 5.2.1，这意味着它与该版本的 Lucene 兼容性极佳，能够提供高效、准确的中文分词服务。 1. **中文分词**：中文分词是自然语言处理中的关键步骤，因为它将连续的汉字序列切...

ikanalyzer中文分词支持lucene7.1.0: ikanalyzer中文分词支持lucene7.1.0是为了解决旧版ikanalyzer与新Lucene版本的兼容性问题而推出的，它使得开发者能够充分利用Lucene的最新特性，同时保持ikanalyzer的优秀分词性能，对于处理中文内容的搜索引擎和...

Lucene4.7+IK Analyzer中文分词入门教程: 在这个入门教程中，我们将使用Lucene 4.7版本，结合IK Analyzer，一个专门针对中文分词的开源分析器，来学习如何构建一个简单的搜索引擎。首先，你需要下载Lucene 4.7和IK Analyzer 2012-FF Hotfix 1。Lucene的...

2018-01lucene-3.5和IKAnalyzer2012全文分词检索技术文档: 使用lucene-3.5和IKAnalyzer2012，实现基础的全文检索实现

IK Analyzer支持Lucene6.0以上版本: 总的来说，IK Analyzer 2012FF_hf1是为了解决与新版本Lucene的兼容性问题而发布的，确保在Lucene 6.0及以上版本中能够正常使用，提供稳定的中文分词服务。对于使用这些版本Lucene的开发者而言，这是一个非常有价值的...

IKAnalyzer中文分词器支持Lucene6.0以上: 提示：IKAnalyzer中文分词器支持Lucene6.0以上，IKAnalyzer中文分词器支持Lucene6.0以上。

Global site tag (gtag.js) - Google Analytics