- 浏览: 1835 次
- 性别:
- 来自: 天津
最新评论
文章列表
之前一直在学习网络爬虫heritrix与lucene,并励志用Heritrix+Lucene做毕业设计,自学挺累的,没有一个明确的方向,一直想找个做搜索的公司实习一段时间,眼看就要毕业了,实习的愿望也快泡汤了,现在只想着多接触一些新的东西。
现在开始学习nutch1.4,由于网上的文章很少是关于1.4的,故写了这篇文章希望对一些想学习网络爬虫的人有一些帮助,同时,也希望你们不要向我一样走了很多弯路,废话少说,直接进入正题吧!
nutch官网http://wiki.apache.org/nutch/NutchTutorial有专门的讲解,我现在把它翻译过来,希望对一些想学习的人 ...
2012-03-11
最近实习单位布置了一个任务,就是要用java解析微软图元文件wmf图像文件的参数信息,懵懵懂懂做了一个礼拜,任务基本上完成了,在此过程中有很多误区,故在此跟大家分享一下自己的感受,希望能给有同样需求的IT人员一点点灵感,不至于陷入到程序中去。
首先简单介绍一下关于微软的wmf文件:微软的wmf文件分为两种一种是标准的图元文件,一种是活动式图元文件,活动式图元文件与标准的图元文件的主要区别是,活动式图元文件包含了图像的原始大小和缩放信息,本文主要介绍活动式图元文件,关于两种文件的具体定义可在百度百科中找到,本文主要讲解用程序如何解析活动式图元文件的坐 ...