`
sunveronica
  • 浏览: 8652 次
  • 性别: Icon_minigender_2
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
  信息检索      信息提取     一般而言,信息抽取系统进行的工作是这样一个计算机程序系统,这个系统的输入时非受限的文本,系统按照用户的预期,从文本中提取出用户预先指定的某些类型的信息。 实质上,信息抽 ...
问题:如何在分割后保留分隔符? 对中文字符串,用标点符号(如!?:;等)作为分隔符,使用string.split()方法,具体代码如下: /********************************************************** * 给段落分句:以句号。、感叹号!、问号?、冒号:、分号;为句子标识符 * @param String paragraph * @return String[] result ***********************************************************/ public String[] SplitSe ...
众所周知,在程序开发中,难免会遇到需要匹配、查找、替换、判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力。因此,学习及使用正则表达式,便成了解决这一矛 ...
在基于 Java 语言的编程中,我们经常碰到汉字的处理及显示的问题。一大堆看不懂的乱码肯定不是我们愿意看到的显示效果,怎样才能够让那些汉字正确显示呢?Java语言默认的编码方式是UNICODE,而我们中国人通常使用的文件 ...
public List<String> readFile(final String filename) throws IOException       {           List<String> filecon = new ArrayList<String>();           String m = "";           BufferedReader file = new BufferedReader(new FileReader("temp.txt"));             while ((m ...
1. String --> InputStream InputStream String2InputStream(String str){    ByteArrayInputStream stream = new ByteArrayInputStream(str.getBytes());    return stream; } 2. InputStream --> String String inputStream2String(InputStream is){    BufferedReader in = new BufferedReader(n ...
四、语言资源的建设   在自然语言信息处理领域,语言资源指的是语料库和语言知识库。前者收录原始的语言材料,后者收录的是反映语言内部结构规律和言语过程认知规律的知识。1998年-2002年期间,国内有许多科研力量投入 ...
http://ling.cass.cn/yingyong/courses/nlpbase.htm   一、概述        计算语言学和自然语言信息处理研究的核心问题是语言的自动理解(Language Understanding)和自动生成(Language Generation)。前者从句子表层的词语符号串识别句子的句法 ...
Global site tag (gtag.js) - Google Analytics