`
deepeye
  • 浏览: 17936 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JE分词的一个异常-220

阅读更多
java.lang.ArrayIndexOutOfBoundsException: -220
at jeasy.analysis.lIIllIlIlIIIllll._$3(Unknown Source:265)
at jeasy.analysis.lIIllIlIlIIIllll._$2(Unknown Source:143)
at jeasy.analysis.lIIllIlIlIIIllll._$1(Unknown Source:58)
at jeasy.analysis.lIIllIlIlIIIllll.next(Unknown Source:38)
at org.apache.lucene.analysis.TokenStream.next(TokenStream.java:91)
at org.apache.lucene.analysis.StopFilter.next(StopFilter.java:120)
at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:134)
at org.apache.lucene.index.DocFieldConsumersPerField.processFields(DocFieldConsumersPerField.java:36)
at org.apache.lucene.index.DocFieldProcessorPerThread.processDocument(DocFieldProcessorPerThread.java:234)
at org.apache.lucene.index.DocumentsWriter.updateDocument(DocumentsWriter.java:765)
at org.apache.lucene.index.DocumentsWriter.addDocument(DocumentsWriter.java:743)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1902)
at org.apache.lucene.index.IndexWriter.addDocument(IndexWriter.java:1880)
at com.huawen.index.WriteIndexer.addForum(WriteIndexer.java:63)
at com.huawen.core.ForumIndexProcessor.AddIndex(ForumIndexProcessor.java:443)
at com.huawen.core.ForumIndexProcessor.opAllForumThreads(ForumIndexProcessor.java:198)
at com.huawen.core.ForumIndexProcessor.process(ForumIndexProcessor.java:95)
at com.huawen.core.ForumIndexProcessor.main(ForumIndexProcessor.java:492)

这个咋解决?
分享到:
评论

相关推荐

    lucene_JE分词_htmlParser--jar包

    标题中的“lucene_JE分词_htmlParser--jar包”表明这是一个包含与Lucene、JE分词和HTMLParser相关的Java库的集合。这些组件在IT领域中有着特定的应用,特别是对于文本处理和搜索引擎构建。 首先,让我们详细了解...

    JE分词 1.4+1.5

    "JE分词 1.4+1.5"是一个针对中文文本处理的工具,主要用于将汉字字符串分割成有意义的词语,这是自然语言处理中的关键步骤。这个版本的JE分词在之前的基础上进行了多方面的改进和增强,使得其在处理中文文本时更为...

    分词器je-analysis-1.5.3.jar

    《深入理解分词器:以je-analysis-1.5.3.jar为例》 在信息技术领域,数据处理是一项至关重要的任务,而在这个过程中,文本分词是基石。分词器是将连续的文本流分解成有意义的词语单元,是自然语言处理(NLP)中的...

    je-analysis-1.5.3、lucene-core-2.4.1分词组件

    本文将深入探讨"je-analysis-1.5.3"和"lucene-core-2.4.1"这两个分词组件,以及它们在相关场景中的应用。 首先,让我们了解什么是分词。分词,即词语切分,是自然语言处理(NLP)中的基本任务之一,它的目标是将...

    MMAnalyzer 分词jar包(lucene-core-2.4.1.jar je-analysis-1.5.3.jar)

    这个分词器在Lucene的基础上,针对中文特性进行了优化,提高了分词效率和准确性,尤其适合对易读性和速度有较高要求的项目。 "lucene-core-2.4.1.jar"是Lucene的核心库,包含了Lucene的基本功能,如索引构建、查询...

    Lucene中文分词组件 JE-Analysis 1.5.1

    //增加一个新词典,采用每行一个词的读取方式(注意:多线程状态下此时的分词效果将不可预料) MMAnalyzer.addDictionary(reader); //增加一个新词 MMAnalyzer.addWord(newWord); //删除词库中的全部...

    je分词jar文件1.5+1.4l两版本

    总的来说,"je分词jar文件1.5+1.4l两版本"提供了一个强大的工具,用于处理中文文本的分词任务,开发者可以根据项目需求选择合适版本的JE-Analysis库进行集成。同时,了解JAR文件的结构和使用方法对于Java开发者来说...

    je-5.0.73-API文档-中英对照版.zip

    赠送jar包:je-5.0.73.jar; 赠送原API文档:je-5.0.73-javadoc.jar; 赠送源代码:je-5.0.73-sources.jar; 赠送Maven依赖信息文件:je-5.0.73.pom; 包含翻译后的API文档:je-5.0.73-javadoc-API文档-中文(简体)-...

    GX Works3的MR-JE-C的CC-LINK IE Field Basic通信_描述文件

    而MR-JE-C系列伺服驱动器是三菱电机推出的一款高性能产品,常用于精确的定位控制。本文将深入探讨如何在GX Works3环境下,实现MR-JE-C伺服驱动器与CC-LINK IE Field Basic网络的通信。 一、GX Works3简介 GX Works...

    je-5.0.73-API文档-中文版.zip

    赠送jar包:je-5.0.73.jar; 赠送原API文档:je-5.0.73-javadoc.jar; 赠送源代码:je-5.0.73-sources.jar; 赠送Maven依赖信息文件:je-5.0.73.pom; 包含翻译后的API文档:je-5.0.73-javadoc-API文档-中文(简体)版...

    转 Lucene中文分词组件 JE-Analysis 1.5.1 天狼

    在这里,我们要探讨的是一个名为"JE-Analysis"的中文分词组件,其版本为1.5.1,又被称为“天狼”。 JE-Analysis是专为Lucene设计的,旨在解决中文分词的问题。它在分词效率和准确性上都进行了优化,以适应大规模...

    4750G I3 BIOS JE40 HR10267-4.zip

    宏基4750G I3 BIOS JE40 HR10267-4.zip是一个专为宏基4750G笔记本电脑中搭载的I3处理器设计的BIOS更新程序,其主要目标是确保系统运行的稳定性和效率。 首先,了解BIOS更新的重要性。BIOS中的错误可能引发各种问题...

    je-analysis-1.5.1

    另一方面,"jeasy"可能是一个子模块或者库,它可能包含了与分词相关的实用工具或API,便于用户集成和使用"je-analysis-1.5.1"。 在实际应用中,"je-analysis-1.5.1"分词器可能包含以下核心功能: 1. **词典支持**...

    je-analysis-1.5.3.zip_JE-Analysis_分词 英文

    总结来说,JE-Analysis 1.5.3是一个高效且易用的中英文分词工具,它的词典扩展功能和多样化的分词模式为各种文本处理任务提供了强大支持。无论是在学术研究还是商业项目中,都能看到其身影。掌握并熟练运用JE-...

    三菱伺服MR-JE使用手册

    - **拆卸内置再生电阻**:在使用特定型号(MR-JE-40A至MR-JE-100A)时,需拆卸内置再生电阻器及其连线。 - **防异物进入**:确保伺服放大器和伺服电机内部没有导电性异物(如螺丝、金属片等)或可燃性异物(如油等)...

    MR-JE-C编程要点.pdf

    JE-C伺服控制要点,方便plc对伺服关键寄存器读写

    三菱MR-JE-C伺服电机FB功能块(适用Q系列PLC) 流水线项目,16个MR-JE-C电机,为了加快编程速度,特意做的一个F

    流水线项目,16个MR-JE-C电机,为了加快编程速度,特意做的一个FB功能块,内部采用局部变量+全局缓冲区的方式进行编程,多次调用不冲突! 适用于Q系列PLC和MR-JE-C的运动控制。 FB功能块包含回原位、PV速度模式、PP...

    je-analysis-1.5.1.jar

    je-analysis-1.5.1.jar 中科院的分词器,用的人很多,需要Lucene1.9-2.4版本才能使用

    je-analysis-1.5.3

    Jeasy,作为压缩包中的另一个文件夹,可能是Je-analysis的一个子项目或工具集,可能包含了便于使用Je-analysis的各种工具和示例代码,例如配置文件、测试用例或样例应用,以帮助开发者快速上手并熟悉组件的使用。...

Global site tag (gtag.js) - Google Analytics