我大一曾经刷过人网人气 网上也有相关软件,大三了发现自己是学习计算机的为什么还要用别人的软件呢,自己不能设计吗?所以自己就像如何设计刷人人网人气的小外挂
一开始自己用java.net.*中一写方法 但是感觉不好下手,有很多方法要你自己解决,于是上网搜了一些开源jar包 发现流行的也就是apache下comments的一个子项目 感觉这里面有很多已经封装好的方法 设置request,response的方法 ,get,post方法,设置参数 这样就很好的控制模拟进入网页了
当然有需要参数,就听人说抓包啊什么的 ,其实自己感觉抓包是抓起数据信息的,没有必要用这么高深的词汇,用firefox加上firedug就可以获得参数了 并且还能看清楚流程
这样用httpclient就能够模拟登陆访问了,但是自己试了试,只能刷一两个,人气就不增加了,是不是访问太频繁了,然后我用线程控制访问时间,发现还是不怎么好使,并且自己申请的几个人人号还被封了,郁闷中。。。。
后来问了一下老师,老师说可以用http动态代理,后来就查询相关知识,发现怎么样提取网站的ip,和port呢? (我感觉就是市面上说的爬虫)一开始我用正则表达式取匹配,但是很困难,后来自己查资料发现有jsoup这个开源的jar包,里面有很多对页面操作的很好封装,就开始使用,经过研究提起出来了数据,但是有很多http代理都不是能用的,也就是refused;
httpclient还用代理访问 这样 我的号就不会被封了 ;
这样就可以刷人气了
但是,话说回来 用了很多jar包,其实自己最应该学习的是怎么实现jar包中内容,
下个目标 ,去写一下jar包中功能
人人网主页:
http://www.renren.com/profile.do?id=282639158
分享到:
相关推荐
初级爬虫
实际操作时,可能还需要考虑登录、分页、动态加载等问题,这些可以通过HttpClient设置cookie和处理重定向,或者使用Jsoup的Jsoup.connect模拟JavaScript执行来解决。 总之,HttpClient和Jsoup是Java开发者进行网页...
这篇博客“HttpClient Jsoup爬取天气预报”可能讲述了如何结合这两者来获取并解析网页上的天气预报信息。 首先,HttpClient允许开发者发送各种HTTP请求(如GET、POST等)到服务器,并接收响应。在爬虫应用中,通常...
基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+...
总的来说,HttpClient与Jsoup的结合使用,为Java开发者提供了一套高效、灵活的数据采集解决方案。通过它们,你可以轻松地从网页中获取并处理所需信息,为数据分析、信息监控或其他相关任务提供支持。但同时也需要...
基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现...
- 使用HttpClient获取原始HTML源码,避免Jsoup直接访问网页可能遇到的JavaScript执行问题。 - 将HttpClient获取的HTML内容传递给Jsoup进行解析,提取所需数据。 - 这种方式适合处理包含复杂JavaScript渲染的页面...
HttpClient和Jsoup是Java开发中常用的两个库,用于处理HTTP请求和解析HTML文档。HttpClient是一个由Apache基金会开发的开源库,提供了丰富的API用于发送HTTP请求并处理响应,而Jsoup则是一个强大的HTML解析器,可以...
HttpClient与JSoup结合使用,可以实现更高级的网页访问和数据获取。 **结合使用JSoup和HTTPClient** 将JSoup与HTTPClient结合,可以创建一个高效且灵活的网页爬虫。首先,HTTPClient负责发起HTTP请求,获取网页的...
在IT领域,网络爬虫是获取网页数据的重要手段,而HttpClient和Jsoup是两种常用的Java库,用于实现这一目的。HttpClient提供了低级别的HTTP通信能力,而Jsoup则是一个解析和操作HTML文档的强大工具。本教程将详细介绍...
包含jsoup-1.7.3.jar,jsoup-1.7.3-javadoc.jar,jsoup-1.7.3-sources.jar,com.springsource.org.apache.commons.httpclient-3.1.0.jar,org.apache.commons.httpclient.jar
包含httpclient-4.5.3.jar,以及其依赖包commons-codec-1.9.jar,commons-logging-1.2.jar,httpcore-4.4.6.jar。包含jsoup-1.10.2.jar
httpClient4.5.3+Jsoup1.10.2 commons-codec-1.9.jar commons-logging-1.2.jar httpclient-4.5.3.jar httpcore-4.4.6.jar jsoup-1.10.2.jar
本文将详细介绍如何将HttpClient与Jsoup整合,以便在进行网络请求时获取并解析网页数据。 HttpClient是Apache软件基金会的一个开源项目,提供了全面的HTTP协议支持,包括标准方法(GET、POST等)、连接管理、重定向...
Jsoup+httpclient模拟登陆和抓取页面.pdf
Google的logo,感觉设计的很好,最近看了java的jsoup(html 解析器)把Google的logo全部下载下来,另外,在Google logos页面发现都是英文的,通过利用Google翻译api对logo说明进行翻译,最终把图片信息以及翻译结果...
**JSoup + HttpClient 简单爬虫** 在信息技术领域,数据抓取,或称“爬虫”,是一种自动化获取网页信息的技术。JavaScript Object Notation (JSON) Soup 和 HttpClient 是两个在Java开发中常用于实现爬虫功能的库。...
本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据,特别是那些通过JavaScript动态加载的数据。 ### Java爬虫基础 Java爬虫是指使用Java语言编写的一类程序,这些程序...