文章列表
信息检索
信息提取
一般而言,信息抽取系统进行的工作是这样一个计算机程序系统,这个系统的输入时非受限的文本,系统按照用户的预期,从文本中提取出用户预先指定的某些类型的信息。
实质上,信息抽 ...
问题:如何在分割后保留分隔符? 对中文字符串,用标点符号(如!?:;等)作为分隔符,使用string.split()方法,具体代码如下: /********************************************************** * 给段落分句:以句号。、感叹号!、问号?、冒号:、分号;为句子标识符 * @param String paragraph * @return String[] result ***********************************************************/ public String[] SplitSe ...
- 2009-10-18 19:34
- 浏览 1422
- 评论(0)
众所周知,在程序开发中,难免会遇到需要匹配、查找、替换、判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力。因此,学习及使用正则表达式,便成了解决这一矛 ...
- 2009-10-18 19:31
- 浏览 614
- 评论(0)
在基于 Java 语言的编程中,我们经常碰到汉字的处理及显示的问题。一大堆看不懂的乱码肯定不是我们愿意看到的显示效果,怎样才能够让那些汉字正确显示呢?Java语言默认的编码方式是UNICODE,而我们中国人通常使用的文件 ...
- 2009-10-16 11:18
- 浏览 600
- 评论(0)
public List<String> readFile(final String filename) throws IOException { List<String> filecon = new ArrayList<String>(); String m = ""; BufferedReader file = new BufferedReader(new FileReader("temp.txt")); while ((m ...
- 2009-10-16 11:15
- 浏览 838
- 评论(0)
String和InputStream的转换
- 博客分类:
- java基础
1. String --> InputStream
InputStream String2InputStream(String str){
ByteArrayInputStream stream = new ByteArrayInputStream(str.getBytes());
return stream;
}
2. InputStream --> String
String inputStream2String(InputStream is){
BufferedReader in = new BufferedReader(n ...
- 2009-10-16 11:12
- 浏览 708
- 评论(0)
四、语言资源的建设
在自然语言信息处理领域,语言资源指的是语料库和语言知识库。前者收录原始的语言材料,后者收录的是反映语言内部结构规律和言语过程认知规律的知识。1998年-2002年期间,国内有许多科研力量投入 ...
- 2009-04-14 23:16
- 浏览 1890
- 评论(0)