`
kofsky
  • 浏览: 201691 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

网页提纯

阅读更多
    有时候发现自己兴趣挺广的,编程,设计,图像处理视频分析,模式识别,文本分析之类,都有点兴趣。看这篇文章 http://blog.csdn.net/lanphaday/archive/2007/08/13/1741185.aspx, 这个想法确实不错:使用文本和HTML代码的密度来决定一行文件是否应该输出,如果选取的内容是正文,那么其中的HTML标签肯定不高。挺有意思的,有时间可以试试这个想法,做一下网页提纯的实验。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics