论坛首页 Java企业应用论坛

原创中文分词代码分享(0)——序言

浏览 2169 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2006-12-26  
        一眨眼大学四年的生活就要过去了,摆在自己面前的也差不多只剩下毕业设计这个“难关”了。很高兴能在大学中找到跟自己志同道合的好朋友,好拍档一起来为我们的毕业设计——基于语义网的信息检索而奋斗。正如主题那样,我所负责的正是中文分词这一部分……
        经过一个月来找工与断断续续的编码相交织的努力,也实现了基于MM(正向最大匹配)与RMM(反向最大匹配)两种方式的分词接口,而在词典表示形式上也尝试了一维线性表,首字Hash结构,双Hash结构3种存储形式。为了更好地提高自己的编码水平,终于鼓足勇气把自己的代码在这里展示给大家,希望大家能对我的编码的不足以及需要改善的地方提出你们宝贵的意见,谢谢……
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics