看了论坛上HTTPClient模拟登陆人人网
的文章,正好今天想注销自己的人人网帐号,又找不到人人网有提供导出日志的功能(超级BS人人网,只提供导入不提供导出),所以想试着用HttpClient做一个,权当练习了。google了一翻,找到了一个python版的导出脚本
,直接改成了java版的,感谢提供脚本的老杨
。
本来只想写个程序自己导出日志用的,所以代码写的不是很OO,还有改进的余地。有兴趣的朋友可以自我发挥。
导出思路:
1、登录帐号。
2、获得日志首页信息。
3、获得最新一篇日志的地址。
4、获得日志的信息,并转换为xml格式。
5、获得下一篇日志的地址,循环读取日志信息直到最后一篇日志。
6、写入xml文件中。
其中获得日志的信息包括日志的标题,日志的发表日期和日志的内容,通过正则表达式完成。
用到的包,请自行导入:
<classpathentry kind="lib" path="apache-mime4j-0.6.jar"/>
<classpathentry kind="lib" path="commons-codec-1.3.jar"/>
<classpathentry kind="lib" path="commons-logging-1.1.1.jar"/>
<classpathentry kind="lib" path="httpclient-4.0.1.jar"/>
<classpathentry kind="lib" path="httpcore-4.0.1.jar"/>
<classpathentry kind="lib" path="httpmime-4.0.1.jar"/>
<classpathentry kind="lib" path="commons-io-1.4.jar"/>
<classpathentry kind="lib" path="commons-lang-2.3.jar"/>
分享到:
相关推荐
在描述中提到,“最新版httpclient自动登录人人代码”意味着这个压缩包包含了一个使用HttpClient实现的人人网登录程序。这个程序可能包含了设置用户名和密码,发送POST请求到人人网登录接口,以及解析和验证登录结果...
关闭HttpClient日志的logback文件
标题中的“用httpclient写的登录开心网”表明我们将探讨如何使用Apache HttpClient库来实现对开心网的模拟登录。HttpClient是一个Java库,它提供了强大的HTTP客户端功能,包括发起HTTP请求、处理响应以及管理会话等...
标题中的“用HttpClient写了一个多线程下载软件”意味着我们将探讨如何使用Apache HttpClient库来创建一个支持多线程的文件下载应用。HttpClient是一个强大的Java库,它提供了丰富的HTTP客户端功能,包括请求发起、...
在这个主题中,我们将深入探讨HTTPCLIENT、日志(LOGGING)以及编码解码(CODEC)相关的知识点。 首先,我们来关注HTTPCLIENT。Apache HttpClient是Apache软件基金会的一个项目,它提供了一组API,用于实现客户端的...
在WPF(Windows Presentation Foundation)应用程序中,使用HttpClient调用Web API是一项常见的任务,尤其是在进行数据交互时。本文将深入探讨如何在WPF应用中利用HttpClient进行异步操作,以避免阻塞主线程,提高...
HttpClient代理访问网络
### Httpclient官网教程中文版知识点总结 #### 一、引言 HTTP协议作为互联网的核心通信标准之一,在现代网络服务及物联网设备中扮演着至关重要的角色。随着技术的发展,越来越多的应用和服务依赖于HTTP协议来实现...
《HttpClient:网络爬虫的核心工具》 HttpClient,作为Java领域中的一个强大库,是网络爬虫开发中的核心组件。它提供了丰富的API,使得开发者能够高效、灵活地进行HTTP请求的发送与响应的处理,从而实现数据的抓取...
HttpClient 4.3 是 Apache 开源组织提供的一个用于构建 HTTP 客户端应用程序的强大库,主要专注于 HTTP 协议的实现。它建立在 HttpCore 库之上,支持传统的阻塞 I/O 模型,适用于各种需要高效、可控的 HTTP 交互的...
标题中的“用httpclient-4.0-alpha2 打造基于http协议的网站分析器”指的是一项使用Apache HttpClient库的版本4.0 alpha2来创建一个能够分析HTTP协议的工具或应用程序。HttpClient是一个Java库,它允许开发人员执行...
使用HttpClient来模拟浏览器GET_POST HttpClient是一个Apache开源组织中的项目,隶属于Jakarta的commons项目,旨在简化HTTP客户端与服务器进行各种通讯编程。通过使用HttpClient,可以轻松地解决以前很头疼的事情,...
4. **超时设置**:可能会提到如何设置请求超时,以防止因服务器响应过慢导致程序阻塞。 5. **异步编程**:由于Unity游戏引擎推荐使用异步操作以避免阻塞主线程,所以会涉及使用async/await关键字来实现非阻塞的网络...
了解HttpClient类以及其对GZIP的支持,对于开发基于MFC的网络应用是非常有帮助的,它可以简化网络通信的复杂性,提高程序的效率。同时,熟悉WININET API和GZIP压缩原理也能增强对网络编程的理解。
android HttpClient 获取网络图片 实例
《深入解析httpclient.jar及其与code.jar的关联》 在Java开发中,HTTP通信是不可或缺的一部分,而Apache HttpClient库正是Java实现HTTP客户端操作的重要工具。本文将深入探讨httpclient.jar包,以及它与code.jar包...