最新文章列表

HttpClient4.x进行Get/Post请求并使用ResponseHandler处理响应

查看原文请移步http://www.yshjava.cn/post/420.html HTTPClient4之后,基本重写了3的所有代码,使得API用起来更显简单有力,最简单的例子体现在get/post请求以及请求响应结果的处理上。3的时候,需要自己处理响应流,无论是网页编码识别还是代码处理等各方面,非常不便,4之后使用ResponseHandler可以非常方便和简洁地处理上述问题。如下代码演示 ...
杨胜寒 评论(0) 有13686人浏览 2013-05-20 10:54

网络爬虫(网络蜘蛛)之网页抓取

查看原文请移步《http://www.yshjava.cn/post/415.html》   现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不是 ...
杨胜寒 评论(1) 有15802人浏览 2013-05-20 10:44

分享:网络舆情监控系统爬虫子系统开发心得与不足

转载自 yshjava的个人博客主页 《分享:网络舆情监控系统爬虫子系统开发心得与不足》 不知不觉,2011已经过去了,这一年中的大多时间,都花在了舆情监控系统的探索和研发上。尤其是作为舆情监控系统的基础子系统——网络爬虫系统,更是消耗了不少的时间和精力。下面简单分享一下在网络爬虫系统设计开发中的一些经验和不足。   首次接触爬虫,是在前年的时候,一次偶然的机会,从图书馆带回一本 ...
杨胜寒 评论(26) 有15580人浏览 2012-01-09 17:07

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics