1、int ICTCLAS_SetPOSmap(int nPOSmap)
* Method: ICTCLAS_SetPOSmap<!指定词性标注集>
* Parameter: int nPOSmap<! 标注集ID>
ICT_POS_MAP_SECOND 0 //计算所二级标注集
ICT_POS_MAP_FIRST 1 //计算所一级标注集
PKU_POS_MAP_SECOND 2 //北大二级标注集
PKU_POS_MAP_FIRST 3 //北大一级标注集
* Returns: int <! 指定成功与否,0 不成功, 非0成功>
2、byte[] ICTCLAS_ParagraphProcess(byte[] sSrc, int eCodeType, int bPOSTagged)接口:
* Method: ICTCLAS_ParagraphProcess<! 分词,返回结果为字符串>
* Parameter: byte[] sSrc<!需要分词的文本内容>
* Parameter: int eCodeType<!字符编码类型>
* Parameter: int bPOSTagged<!是否词性标注,1:标注,0:不标注.标注的词集根据ICTCLAS_SetPOSmap的设置值来定 >
* Returns: byte[]<! 分词后的字符串的字节编码>
调用示例:
package ICTCLAS.I3S.test;
import java.io.UnsupportedEncodingException;
import ICTCLAS.I3S.AC.ICTCLAS50;
public class Test_ICTCLAS_ParagraphProcess {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
ICTCLAS50 ictclas = new ICTCLAS50();
String useage = "Useage : java Test_ICTCLAS_ParagraphProcess sPath [nPOSmap]";
if (args.length < 1) {
System.err.println(useage);
return;
}
try {
if (!ictclas.ICTCLAS_Init(args[0].getBytes("GB2312"))) {
System.err.println("Initial fail!");
return;
}
System.out.println("Initial success!");
String input = "中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS。";
/* 设置词性标注集(0 计算所二级标注集,1 计算所一级标注集,2 北大二级标注集,3 北大一级标注集) */
int nPosmap = args.length == 2 ? Integer.valueOf(args[1]) : 1;
ictclas.ICTCLAS_SetPOSmap(nPosmap);
byte nativeBytes[] = ictclas.ICTCLAS_ParagraphProcess(input
.getBytes("GB2312"), 0, 1);
String nativeStr = new String(nativeBytes, 0, nativeBytes.length,
"GB2312");
System.out.println("The result is :" + nativeStr);
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
ictclas.ICTCLAS_Exit();
}
}
}
分享到:
相关推荐
ICTCLAS50_Windows_32_JNI 的使用,介绍ICTCLAS50_Windows_32_JNI 在eclipse等环境下的配置,以及怎么测试ICTCLAS50_Windows_32_JNI
ICTCLAS50_Windows_64_JNI ICTCLAS的API,文档等
中科院中文分词windows 64位系统JNI方式调用程序。
中科院分词系统java版 ICTCLAS50_Windows_32_JNI.rar ;里面有最新的授权文件,正确执行demo;里面包含java借口使用说明以及分词系统的演示说明
中科院分词系统+ICTCLAS2011+JNI版(Java语言)源代码学习
中科院分词软件,用于语料预处理,不错的。
中科院分词器ictclas50 本人亲测windows64位可以使用
ICTCLAS50_Windows_32_JNI.rar 文件是一个包含Jena库的压缩包,主要关注Jena的推理功能,适用于Windows 32位环境,并且提供了JNI(Java Native Interface)支持。Jena是一个开源的Java框架,专门用于处理语义网和...
ICTCLAS 2011 c/c++/c#版、JNI版均支持多线程调用。 3、支持UTF-8 以往版本需要进行编码转换,统一转换成GB2312之后才能做进一步处理。系统当前版本支持GB2312、GBK、GB18030、UTF-8、BIG5。以上编码无需做任何...
lib.ICTCLAS_ParagraphProcess(input_text.encode('utf-8'), len(input_text), output) # 输出结果 print(output[0].decode('utf-8')) # 关闭资源 lib.ICTCLAS_Destroy() ``` **五、进阶应用** 1. **自定义模型*...
中科院分词工具,jni调用,包括文档和demo。该demo为改造版,官方提供的的ICTCLAS2011在java中使用总是报错,这个demo可以正常使用
Java调用ICTCLAS2013涉及到的是在Java程序中使用ICTCLAS(中文语言分析系统)2013版进行中文处理的任务,主要包括中文分词、词性标注、命名实体识别和新词识别。ICTCLAS是一个高效、实用的中文自然语言处理工具,...
为http://ictclas.org/所发布软件的免费共享版,此版为JNI版,没有使用时间限制,
陈天教授的ICTCLAS Java版继承了原系统的优点,如高效、准确和适应性强,同时提供了跨平台的Java接口,使得开发者可以方便地在各种操作系统上集成这一分词工具,包括Windows、Linux和Mac OS等。由于Java语言的特性,...
ICTCLAS功能齐全,门类齐全,包括jar包,dll动态文件,Linux的.so、windows的.dll全都有,不要感激我,我只是知识的传播者。
3. **JNI(Java Native Interface)**:当Java程序需要调用本地系统库(如C/C++库)时,JNI提供了一个接口。DLL文件就是Windows系统下的本地库,通过JNI,Java代码可以与这些底层库交互。 4. **软件部署**:在实际...