`

antdz网站内容批量提取器

    博客分类:
  • Qt4
 
阅读更多



 


嗯,这个程序基本完成了。今天测试了一下,虽没有想象中好,但是还能用。在未来的日子里会细化的。
用这个程序把从新浪上下载的网页给合成了,呵呵,不错,不错~~~

 

-------------------------------------------------------------------------------------------------------------

antdz采集器说明
作者: antdz (菜鸟一只)
email: vip_antdz@163.com
几个月前,从新浪读书中发现了一本好书,就用迅雷下载了全部链接,打算编辑到一个文件中。结果发现下载的网页太多了,假如使用复制粘贴过于繁琐,就想做个小程序,批量完成这个工作。其中写这个程序用的时间不长,因为工作等原因,间隔时间很长。还好,今天做完了大概功能。在以后的日子里再进行慢慢细化吧。
2011-6-19


ver 0.1001

运行spider.exe

使用add 批量添加文本文档(txt html htm),在正则表达式里填写要提取的内容的正则表达式,再点let's go按钮。中间会卡一下,在以后的版本中会细化。
在没有添加文本文档前不要按 let's go 及testRegExp按钮,会出现错误的。在以后的版本中会细化。

提取的内容会存放在和程序一个目录下的tmp.txt文件中。

  • 大小: 47.5 KB
  • 大小: 147.2 KB
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics