最新文章列表

Java分布式中文分词组件 - word分词

Java分布式中文分词组件 - word分词
yangshangchuan 评论(2) 有25225人浏览 2014-04-29 11:29

word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估

word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。   word分词器分词效果评估主要评估下面7种分词算法:   正向最大匹配算法:MaximumMatching逆向最大匹配算 ...
yangshangchuan 评论(0) 有7569人浏览 2014-04-29 09:33

介绍一种基于角色标注+字词体位法的人名识别方式-Ansj中文分词

      大家好.最近在做分词.在分词中遇到了各种各样的问题.在这里选择一个比较有意思的与大家分享.       在这里说分词有点老生常谈了.的确.中文分词已经非常成熟了.但是在实体名识别上一直是中文分词的软肋.最近通过对ictclas的学习,和自己的总结.得出了一个还算不错的人名识别系统.       目前这种方式已经开源.大家可以参看:https://github.com/ansjsun/ ...
ansjsun 评论(14) 有7250人浏览 2012-09-14 13:35

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics