大家都知道 使用httpClient能模拟浏览器发起请求,得到想要的反回结果。
但在互联网中存在这样一种情况,某些资源只有登录后才可以查看或下载
例如:百度文库、部分论坛(只有登录后才可以看某些板块)
浏览器实现这个效果需要如下几个步骤:
Ø 1请求一个需要登录的页面或资源
Ø 2服务器判断当前的会话是否包含已登录信息。如果没有登录重定向到登录页面
Ø 3手工在登录页面录入正确的账户信息并提交
Ø 4服务器判断登录信息是否正确,如果正确则将登录成功信息保存到session中
Ø 5登录成功后服务器端给浏览器返回会话的SessionID信息保存到客户端的Cookie中
Ø 6浏览器自动跳转到之前的请求地址并携带之前的Cookie(包含登录成功的SessionID)
Ø 7服务器端判断session中是否有成功登录信息,如果有则将请求的资源反馈给浏览器
下面使用HttpClient模拟上述过程,这里只实现手工发起登录,并携带Cookie发起第二次请求资源的过程。(网上实际有过好多这样的例子,这里只是自己写出来备忘)
此处请求的是Iteye的博客主页,其他地址需要手动构建下URL。
本文是一个的是 httpClient 4.2.5 httpCore 4.2.4
有这两个jar包
使用maven构建的,需要下载jar包的可以使用添加如下依赖
<dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.2.5</version> </dependency>
没有maven支持的也可以到apache的网站上去下载,方式有好多种或联系我
下面给出Java代码
package org.jshand.utils.http; import java.io.FileOutputStream; import org.apache.http.HttpEntity; import org.apache.http.HttpResponse; import org.apache.http.client.CookieStore; import org.apache.http.client.methods.HttpGet; import org.apache.http.client.methods.HttpPost; import org.apache.http.impl.client.DefaultHttpClient; import org.apache.http.impl.conn.PoolingClientConnectionManager; import org.apache.http.util.EntityUtils; /** * TODO(用一句话描述该文件的作用) * * @title: HttpClientDemo.java * @author zhangjinshan-ghq * @date 2014-6-11 14:59:04 */ public class HttpClientDemo { /** * The main method. * * @param args the arguments * @throws Exception the exception */ public static void main(String[] args) throws Exception { getResoucesByLoginCookies(); } /** * 根据登录Cookie获取资源 * 一切异常均未处理,需要酌情检查异常 * * @throws Exception */ private static void getResoucesByLoginCookies() throws Exception { HttpClientDemo demo = new HttpClientDemo(); String username = "XXXXXXXXX";// 登录用户 String password = "XXXXXXXX";// 登录密码 // 需要提交登录的信息 String urlLogin = "http://www.iteye.com/login?name=" + username + "&password=" + password; // 登录成功后想要访问的页面 可以是下载资源 需要替换成自己的iteye Blog地址 String urlAfter = "http://314649444.iteye.com/"; DefaultHttpClient client = new DefaultHttpClient(new PoolingClientConnectionManager()); /** * 第一次请求登录页面 获得cookie * 相当于在登录页面点击登录,此处在URL中 构造参数, * 如果参数列表相当多的话可以使用HttpClient的方式构造参数 * 此处不赘述 */ HttpPost post = new HttpPost(urlLogin); HttpResponse response = client.execute(post); HttpEntity entity = response.getEntity(); CookieStore cookieStore = client.getCookieStore(); client.setCookieStore(cookieStore); /** * 带着登录过的cookie请求下一个页面,可以是需要登录才能下载的url * 此处使用的是iteye的博客首页,如果登录成功,那么首页会显示【欢迎XXXX】 * */ HttpGet get = new HttpGet(urlAfter); response = client.execute(get); entity = response.getEntity(); /** * 将请求结果放到文件系统中保存为 myindex.html,便于使用浏览器在本地打开 查看结果 */ String pathName = "d:\\myindex.html"; writeHTMLtoFile(entity, pathName); } /** * Write htmL to file. * 将请求结果以二进制形式放到文件系统中保存为.html文件,便于使用浏览器在本地打开 查看结果 * * @param entity the entity * @param pathName the path name * @throws Exception the exception */ public static void writeHTMLtoFile(HttpEntity entity, String pathName) throws Exception { byte[] bytes = new byte[(int) entity.getContentLength()]; FileOutputStream fos = new FileOutputStream(pathName); bytes = EntityUtils.toByteArray(entity); fos.write(bytes); fos.flush(); fos.close(); } }
相关推荐
Java Web 中 HttpClient 模拟浏览器登录后发起请求是指在 Java Web 应用程序中使用 HttpClient 库模拟浏览器的行为,模拟浏览器登录到服务器,然后发起请求获取资源。这种技术广泛应用于爬虫、自动化测试、数据爬取...
除此之外,我们对请求添加签名的校验,key设置为X-Sign 接口定义 /// /// 获取时间戳(毫秒). /// /// <param name=dateTime></param> /// <returns></returns> [HttpPost] [AllowAnonymous]
这个库广泛应用于Web服务调用、API接口测试以及自动化脚本中,因为它可以模拟浏览器的行为,进行GET、POST等复杂的HTTP请求。 在Java编程中,HttpClient提供了一个强大的API,允许我们创建自定义的HTTP请求,设置...
JAVA使用HttpClient模拟浏览器GET、POST请求 在本文中,我们将介绍如何使用Apache Commons HttpClient库来模拟浏览器的GET和POST请求。HttpClient库是一个开放源码的项目,是Apache Commons项目的一部分,旨在简化...
在这个场景中,我们关注的是如何使用`httpclient`进行模拟登录并携带cookie来访问后续的URL。这个过程通常涉及到处理session和身份验证,对于开发需要登录功能的Web应用或自动化测试脚本尤其有用。 首先,`...
在"java httpclient 模拟登录"这个场景下,我们通常会用到HttpClient来模拟用户登录网站的过程,获取登录后的session信息,以便后续能够访问登录后才能看到的页面内容。以下将详细介绍如何使用Java HttpClient进行...
但是考虑到一些服务授权的问题,很多公司提供的页面往往并不是可以通过一个简单的URL就可以访问的,而必须经过注册然后登录后方可使用提供服务的页面,这个时候就涉及到COOKIE问题的处理。我们知道目前流行的***页...
使用HttpClient来模拟浏览器GET_POST HttpClient是一个Apache开源组织中的项目,隶属于Jakarta的commons项目,旨在简化HTTP客户端与服务器进行各种通讯编程。通过使用HttpClient,可以轻松地解决以前很头疼的事情,...
登录可能需要设置特定的请求头,如Cookie或User-Agent,以模拟浏览器行为: ```java httpPost.setHeader(HttpHeaders.USER_AGENT, "Mozilla/5.0"); ``` 4. **添加表单参数** 通过`NameValuePair`或`...
每次请求后,我们使用`Task.Delay`方法随机等待0到5秒,模拟浏览器行为。 为了模拟更复杂的浏览器请求,如POST请求,你需要设置请求头和请求体。例如,对于一个POST请求,你可以这样做: ```csharp using System...
1. **创建HttpClient实例**:HttpClient是整个模拟登录的核心,通过`HttpClientBuilder`构建器创建一个HttpClient对象,以便发起HTTP请求。 2. **设置Cookie管理器**:为了处理登录过程中产生的Cookie,需要配置`...
本篇文章将详细讲解如何使用HttpClient进行模拟登录操作,结合源码分析,帮助开发者深入理解其工作原理。 HttpClient库由Apache基金会开发,提供了全面的HTTP协议支持,包括标准与扩展的HTTP方法、连接管理、重试...
在后续的HTTP请求中,通过`HttpClient`的`setCookieStore()`方法设置这个`CookieStore`,这样HTTPClient就会自动添加Cookie到请求头,模拟浏览器的行为。 六、实战代码示例 ```java CloseableHttpClient ...
HttpClient还支持其他高级功能,如重试策略、Cookie管理、多部分表单数据上传等。在实际项目中,我们通常会封装一个HttpClientUtil工具类,以简化请求的创建和执行过程。 例如,一个简单的HttpClientUtil工具类可能...
本篇文章将深入讲解如何使用`HttpURLConnection`类来模拟浏览器请求,并通过实例展示其在接口调用中的应用。 首先,`HttpURLConnection`是`java.net.URLConnection`的一个子类,用于处理HTTP协议。在使用`...
在本文中,我们将深入探讨如何使用HttpClient来模拟浏览器的GET和POST操作,以及相关的源码分析和工具使用技巧。 首先,让我们了解GET和POST请求的基本概念。GET是HTTP协议中最常见的请求方法,通常用于获取服务器...
4. **模拟登录请求**: 发送POST请求,携带登录所需的用户名和密码。这里使用`HttpPost`对象和`EntityBuilder`构建请求体: ```java HttpPost loginRequest = new HttpPost("http://example.com/login"); List...
HttpClient模拟http发送post和get请求
当我们谈论“浏览器发送模拟httpclient软件”时,我们指的是一个能够模拟浏览器行为的应用程序,允许用户通过编程方式执行HTTP请求,如POST和GET。 POST和GET是HTTP请求的两种主要方法。GET用于从服务器获取资源,...