`
wd_2007
  • 浏览: 1353 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论
文章列表
在网上看了别人写的,感觉挺好,收录下。 http://blog.sina.com.cn/s/blog_64d0b03c0101bcxk.html 中文分词做为自然语言处理的第一工序.有着十分重要的意义,在一定程度上可以说,没有分词,所谓的分类,句法树,聚类,特征词提取,文本摘要...都是空谈.分词用简单直白的方法处理就是建立一个自己的词库,然后用正向或逆向方式遍历句子,发现有在词库中的就进行切词,这样就能完成一个简单的分词程序.当然效率方面就有很多改进方式了.如词库的存储结构,程序是否建立单例模式,查询算法之类都会直接影响速率.这方面不再做过多讲解了.下面对今天的几个知识点做下补充讲解. ...
Global site tag (gtag.js) - Google Analytics