`
emily2ly
  • 浏览: 166615 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
社区版块
存档分类
最新评论

使用ICTCLAS JAVA版(ictclas4j)过程中的错误及其解决

阅读更多

1.在Dictionary.java里面的getMaxMatch()函数里要注意加上对wis的判断语句

if(wis != null)

否则有时会报出越界错误。

 

2.在PosTagger.java里面的computePossibility()函数里要注意将对i的判断语句

i < startPos + length

  改为

i < startPos + length - 1 
否则有时会报出越界错误。

 

3.在AdjustSeg.java里面的 finaAdjust()函数里要注意将while语句的判断条件

while (true)

改为

while (true && i + 1 < optSegPath.size()) 

否则有时会报出越界错误。

 

(完)

create@2010-03-22

  • 大小: 12.7 KB
分享到:
评论
2 楼 zxb2012 2012-02-22  
THX!!!
1 楼 jack547155187 2011-01-18  
非常感谢

相关推荐

    ICTCLAS Java版

    这个“ICTCLAS Java版”是该工具的一个Java实现版本,意味着开发者可以使用Java编程语言来调用和集成这个强大的分词引擎。 在sinboy的Java版分词系统基础上进行的修改,通常是为了适应特定需求或者优化性能。可能的...

    ictclas4j java版 for lucene

    ictclas4j java版 for lucene

    ictclas4j-.rar_FreeICTCLAS_ICTCLAS_ictclas4j_ictclas4j java

    ictclas4j java版实现,可供参考

    ICTCLAS的Java分词系统

    4. `jawin.library`:这可能是一个Java本地库,与`ICTCLAS.dll`类似,用于在Java环境中调用非Java代码。 5. `.local` 和 `.local~` 文件:这些可能是配置文件或者临时文件,用于存储特定环境下的设置。 6. `hs_err...

    ICTCLAS的Java改造版本

    但在使用过程中发现问题很多。其中最大的问题,就是数据结构不够合适,统统采用arraylist来存储,结果造成了可悲的内存溢出问题。 我觉得这是对原来代码的理解不够造成的。 于是自己动手,从原来的C++版本,基本上...

    ictclas4j.rar_ictclas4j_ictclas4j data_www.tr4j.com_分词java_分词和标注

    本代码用java实现了分词功能,包括分词和词性标注,里面有具体的说明文档,包括数据结构的设计,分词步骤,分词系统研究等。

    Java调用ICTCLAS2013

    Java调用ICTCLAS2013涉及到的是在Java程序中使用ICTCLAS(中文语言分析系统)2013版进行中文处理的任务,主要包括中文分词、词性标注、命名实体识别和新词识别。ICTCLAS是一个高效、实用的中文自然语言处理工具,...

    ictclas4j分词工具包

    最好的中分分词工具ictclas 最好的中分分词工具ictclas 最好的中分分词工具ictclas

    ictclas4j

    ictclas中科院分词

    ICTCLAS java中文分词工程

    ICTCLAS 中文分词的elipse 工程

    ictclas4j中文分词测试

    NULL 博文链接:https://lionsadness.iteye.com/blog/689910

    ictclas4j for lucene 2.4

    ictclas4j for lucene 2.4 任何人不得将此用于商业用途,仅限个人学习研究之用.该开源项目遵循Apache License 2.0

    ICTCLAS_Source_Analysis.rar_ICTCLAS_ICTCLAS java_ICTCLAS-analysi

    Java版的ICTCLAS通常提供了丰富的API接口,方便开发者在Java项目中集成和调用。 "ictclas_analysis.jar"可能是ICTCLAS的分析工具或者服务,可能包含了一些用于测试、性能评估或者调试的功能。开发者可以通过这个...

    ictclas4j调整

    NULL 博文链接:https://summerbell.iteye.com/blog/1354546

    中文分词包——ictclas4j_0.9.1.jar

    基于Lucene的中文分词包,ictclas4j的最新发布,已经打包成jar包。

    Java+ICTCLAS

    完成的ICTCLAS项目,可以为初学中文分词的同学提供一个学习的机会。本人也是初学。

    ictclas4j 0.9.1 相关字典、源码、开发文档打包

    sinboy发表的ictclas4j-0.9.1版(最新)相关的字典、源码和开发文档打包

    JAVA实现ICTCLAS2015分词

    在JAVA中实现ICTCLAS2015,开发者通常会采用以下步骤: 1. **导入库**:首先,你需要引入ICTCLAS的JAVA接口库,这通常是一个.jar文件,如`ictclas.jar`。这个库提供了与ICTCLAS C++核心引擎交互的API。 2. **初始...

    分词系统ictclas Java实现

    采用Java实现分词系统,包括去除停用词,文本处理完毕后输出到txt

Global site tag (gtag.js) - Google Analytics