最新文章列表

怎样从住建部网站抓取最新开盘的商品房价格信息?(原创方法)

   前久,一个朋友让我帮写个程序抓取即将开盘的XXX 楼盘的信息,以方便开盘后迅速筛选出价格合适的房间。 该网站查看房间信息的流程如下: 1、 ...
zqs5123 评论(0) 有811人浏览 2012-12-12 16:40

HtmlPaser与StringEscapeUtils共舞抓取网页

用正则来匹配的确很强大,但如果是网页的话HtmlPaser更方便,由于抓下来的信息中文是unicode的,所以要用到apache的一个包,以下是代码: import java.net.URL; import org.apache.commons.lang3.StringEscapeUtils; import org.htmlparser.NodeFilter; import org.h ...
chenpenghui 评论(0) 有1522人浏览 2011-12-13 14:48

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics