`
jyjsjd
  • 浏览: 19757 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

ICTCLAS50添加注释

 
阅读更多

package ICTCLAS.I3S.AC;

public class ICTCLAS50 {
	
	/***********************************************************************
	 * 各个接口中,字符编码参数的需按照如下设置,接口参数中不再详细说明, 若编码不确定,系统将会自动识别编码
	 * (0:编码未知,系统将会自动识别)
	 * (1:ASCII)
	 * (2:gb2312、GBK、gb18030)
	 * (3:UTF-8)
	 * (4:BIG5)
	*************************************************************************/

	/************************************************************************
	* Method:     ICTCLAS_Init<!读取配置文件,加载词典等>
	* Parameter:  byte[] sPath<!配置文件configure.xml,授权文件user.lic及data文件夹所在路径的字节编码 >
	* Returns:      bool<!初始化是否成功>
	* Description: 调用其它任何接口前,必须保证本接口调用成功!
	* Remark: 1.2010/06/03 17 : 34 created by x10n6y version 5.0 
	*************************************************************************/
	public native boolean ICTCLAS_Init(byte[] sPath);
	

	/************************************************************************
	* Method:     ICTCLAS_Exit<! 退出,释放相关资源>
	* Returns:     ICTCLAS_API bool<! 退出是否成功>
	* Description:	所有操作完成后,请调用本接口释放相关资源!
	* Remark: 1.2010/06/04 9 : 42 created by x10n6y version 5.0 
	*************************************************************************/
	public native boolean ICTCLAS_Exit();
	
	
	/************************************************************************
	* Method:     ICTCLAS_ImportUserDictFile<! 导入用户词典文件>
	* Parameter:  byte[] sPath<! 用户词典路径名称>
	* Parameter:  int eCodeType<!词典编码类型>
	* Returns:      ICTCLAS_API unsigned int<! 成功导入的词汇数量>
	* Description: 用户导入词汇文件格式如下:
	                        1.词语与词性用‘@@’间隔。例如:“中科院@@nr;
							2.一行一词;
							3.词性可省略

	* Remark: 1.2010/06/04 9 : 43 created by x10n6y version 5.0 
	************************************************************************/
	public native int ICTCLAS_ImportUserDictFile(byte[] sPath, int eCodeType);

	
	/************************************************************************
	* Method:     ICTCLAS_SaveTheUsrDic<!保存用户词典>
	* Description:1.本接口将会覆盖原有/data/文件夹用户相关词典。  
	                     2.用户可在配置文件中,指定下次是否使用该词典。
	*
	* Remark: 1.2010/07/05 16 : 16 created by x10n6y version 2.0 
	*************************************************************************/
	public native int ICTCLAS_SaveTheUsrDic();

	/************************************************************************
	* Method:     ICTCLAS_SetPOSmap<!指定词性标注集>
	* Parameter:  int nPOSmap<! 标注集ID>
						ICT_POS_MAP_SECOND 0 //计算所二级标注集
						ICT_POS_MAP_FIRST 1  //计算所一级标注集
						PKU_POS_MAP_SECOND 2 //北大二级标注集  
						PKU_POS_MAP_FIRST 3	//北大一级标注集

	* Returns:    ICTCLAS_API bool<! 指定成功与否>
	* Description: 
	* Remark: 1.2010/06/22 11 : 11 created by x10n6y version 5.0 
	*************************************************************************/
	public native int ICTCLAS_SetPOSmap(int nPOSmap);

	
	/************************************************************************
	* Method:     ICTCLAS_FileProcess<!文本文件分词>
	* Parameter:  byte[] sSrcFilename<!要分词的文件>
	* Parameter: int eCodeType<!要处理的文本编码类型>
	* Parameter:  int bPOSTagged<! 是否词性标准>
	* Parameter:  byte[] sDestFilename<! 结果文件存放位置>
	* Returns:      ICTCLAS_API bool<! 分词是否成功>
	* Description: 1.用户若不指定分词结果保存位置,系统将结果保存至
	                        当前目录下,test_result.txt 中。
						 2.pszDstFileName若该文件不存在, 则自动生成;
						    否则先清空已有内容。
	* Remark: 1.2010/06/22 11 : 11 created by x10n6y version 5.0 
	*************************************************************************/
	public native boolean ICTCLAS_FileProcess(byte[] sSrcFilename,
			int eCodeType, int bPOSTagged, byte[] sDestFilename);

	
	/************************************************************************
	* Method:     ICTCLAS_ParagraphProcess<! 分词,返回结果为字符串>
	* Parameter:  byte[] sSrc<!需要分词的文本内容>
	* Parameter:  int eCodeType<!字符编码类型>
	* Parameter:  int bPOSTagged<!是否词性标注 >
	* Returns:      byte[]<! 分词后的字符串的字节编码>
	* Description: 调用本接口,由用户分配内存,保存结果(pszResult)
	,建议内存大小strlen(pszText)*6!
	* Remark: 1.2010/06/22 11 : 11 created by x10n6y version 5.0 
	*************************************************************************/
	public native byte[] ICTCLAS_ParagraphProcess(byte[] sSrc, int eCodeType,
			int bPOSTagged);

	
	/************************************************************************
	* Method:     nativeProcAPara<! 分词,返回ICTCLAS_Result类对象对应的字节序列,需要按照一定的规则将其进行编码>
	* Parameter:  byte[] sSrc<! 需要分词的文本内容>
	* Parameter:  int bPOStagged<! 是否词性标注>
	* Returns:      byte[] <! ICTCLAS_Result类对象对应的字节序列>
	* Description:( ~_~这个接口现在还不是很明白怎么对其返回结果进行处理,希望各位网友赐教~_~)
	* Remark: 1.2010/06/22 11 : 11 created by x10n6y version 5.0 
	*************************************************************************/
	public native byte[] nativeProcAPara(byte[] sSrc, int eCodeType,
			int bPOStagged);

	/* Use static intializer */
	static {
		System.loadLibrary("ICTCLAS50");
//		System.out.println("load ictclas50...");
	}
}
 
分享到:
评论

相关推荐

    ICTCLAS50 ICTCLAS50综合包

    ICTCLAS50综合包ICTCLAS50综合包ICTCLAS50综合包

    ICTCLAS50综合包

    ICTCLAS50综合包是涉及中文自然语言处理的一个重要工具包,主要聚焦于统计语言模型,特别是N-Gram模型和平滑技术的应用。N-Gram模型是基于马尔科夫假设的一种统计方法,用于预测序列中下一个元素的概率,广泛应用于...

    ictclas50_windows64

    中科院分词器ictclas50 本人亲测windows64位可以使用

    ICTCLAS50_Linux_RHAS_64_C.rar

    ICTCLAS50_Linux_RHAS_64_C.rar 是一个针对Linux系统,特别是Red Hat Enterprise Linux 64位版本的软件包。这个压缩文件包含了多个组成部分,包括Sample(示例)、Doc(文档)、API(应用程序接口)和Demo(演示)。...

    ICTCLAS50_Windows_64_C(2).rar

    ICTCLAS50_Windows_64_C(2).rar 是一个针对中文处理的重要工具,主要功能是中文分词。中文分词是自然语言处理(NLP)中的基础任务,对于理解和分析中文文本至关重要。这个软件包适用于Windows 64位系统,并且是C语言...

    ICTCLAS50_Windows_32_JNI 的使用

    ICTCLAS50_Windows_32_JNI 的使用,介绍ICTCLAS50_Windows_32_JNI 在eclipse等环境下的配置,以及怎么测试ICTCLAS50_Windows_32_JNI

    中科院ICTCLAS50_Windows分词

    中科院ICTCLAS50_Windows分词,内含32位与64位,能智能地将一段文字分解成词语,可以用于翻译,比如要翻译一段话,机器如何知道那几个字是一个词呢?就需要先通过分词,再翻译,当然现在智能的翻译肯定不是逐词翻译...

    ICTCLAS50 Delphi调用例程

    Delphi下调用ICTCLAS50的参考方法

    ICTCLAS50分词系统API-Delphi

    delphi下调用ICTCLAS50的接口文件

    ICTCLAS50_Windows_64_JNI.rar_ICTCLAS_ICTCLAS java_ICTCLAS50_ictc

    ICTCLAS50_Windows_64_JNI ICTCLAS的API,文档等

    ICTCLAS50.dll 破解版

    下载了ICTCLAS50_Windows_32_C调试demo,发现提示初始化失败,查看log文件说是许可无效或过期...很想看下效果,就OD了下,然后就开源直接绕过许可验证了。

    ICTCLAS50_Windows_32_C

    ICTCLAS 2011较以往版本主要有以下变化: 1、内核全新改版  内核改版后,分词速度更快普通机器平均 500KB/s左右,稳定性更高。 2、支持多线程  ICTCLAS 2011 c/c++/c#版、JNI版均支持多线程调用。 3、支持UTF-8...

    ICTCLAS50_Windows_32_JNI.zip_ICTCLAS50_ICTCLAS50.h_ictclass_语料

    中科院分词软件,用于语料预处理,不错的。

    中科院分词ictclas50 windows 32 JNI

    中科院分词工具,jni调用,包括文档和demo。该demo为改造版,官方提供的的ICTCLAS2011在java中使用总是报错,这个demo可以正常使用

    中科院分词工具ICTCLAS50_Windows_32_C综合包

    包括四个包:API、Demo、Doc、Sample 其中Demo下包括绿色版分词工具 Doc下有C/C++、Java、C#接口说明文档

    ICTCLAS50_Windows_64_JNI

    中科院中文分词windows 64位系统JNI方式调用程序。

    中科院分词系统java版ICTCLAS50_Windows_32_JNI.rar

    中科院分词系统java版 ICTCLAS50_Windows_32_JNI.rar ;里面有最新的授权文件,正确执行demo;里面包含java借口使用说明以及分词系统的演示说明

    ICTCLAS Java版

    2. 功能增强:添加新的功能,如词性标注、关键词提取等,以满足更复杂的应用场景。 3. 用户接口改进:提供更加友好的API,使得开发者更容易集成到自己的项目中。 4. 错误修复:修正原版可能出现的问题,提高软件的...

    ICTCLAS中文分词系统

    ICTCLAS中文分词系统是基于信息技术(ICT)和自然语言处理(NLP)的工具,主要用于处理中文文本。这个系统由中关村的科研团队开发,代表着国内在中文分词技术领域的先进水平。分词是中文信息处理的重要步骤,因为...

Global site tag (gtag.js) - Google Analytics