`
yechw
  • 浏览: 59258 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

用HttpClient写的导出人人网日志的程序

阅读更多

看了论坛上HTTPClient模拟登陆人人网 的文章,正好今天想注销自己的人人网帐号,又找不到人人网有提供导出日志的功能(超级BS人人网,只提供导入不提供导出),所以想试着用HttpClient做一个,权当练习了。google了一翻,找到了一个python版的导出脚本 ,直接改成了java版的,感谢提供脚本的老杨

 

本来只想写个程序自己导出日志用的,所以代码写的不是很OO,还有改进的余地。有兴趣的朋友可以自我发挥。

 

导出思路:

1、登录帐号。

2、获得日志首页信息。

3、获得最新一篇日志的地址。

4、获得日志的信息,并转换为xml格式。

5、获得下一篇日志的地址,循环读取日志信息直到最后一篇日志。

6、写入xml文件中。

 

其中获得日志的信息包括日志的标题,日志的发表日期和日志的内容,通过正则表达式完成。

 

用到的包,请自行导入:

<classpathentry kind="lib" path="apache-mime4j-0.6.jar"/>
<classpathentry kind="lib" path="commons-codec-1.3.jar"/>
<classpathentry kind="lib" path="commons-logging-1.1.1.jar"/>
<classpathentry kind="lib" path="httpclient-4.0.1.jar"/>
<classpathentry kind="lib" path="httpcore-4.0.1.jar"/>
<classpathentry kind="lib" path="httpmime-4.0.1.jar"/>
<classpathentry kind="lib" path="commons-io-1.4.jar"/>
<classpathentry kind="lib" path="commons-lang-2.3.jar"/>
分享到:
评论
4 楼 lee_3do 2010-10-25  
yechw 写道
lee_3do 写道
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了

是吗?我的帐号注销了,不然改天上去再看一下。

是啊,前几天看了一下,楼主好像是先找到人人上日志的首页,现在人人改版貌似得不到这个日志的首页了,于是也就得不到相关日志的地址了。不过人人还有个地址http://m.renren.com/,可以从这里登录得到日志的首页,别的应该都没问题。不过还是多谢楼主啦~
3 楼 yechw 2010-10-12  
lee_3do 写道
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了

是吗?我的帐号注销了,不然改天上去再看一下。
2 楼 lee_3do 2010-10-10  
貌似人人大改版,楼主这个好像不行了,看来还是得抽个时间自己再写一个了
1 楼 lee_3do 2010-10-09  
多谢楼主啦,本来想自己写个呢,呵呵

相关推荐

    httpclient4.3登陆人人

    在描述中提到,“最新版httpclient自动登录人人代码”意味着这个压缩包包含了一个使用HttpClient实现的人人网登录程序。这个程序可能包含了设置用户名和密码,发送POST请求到人人网登录接口,以及解析和验证登录结果...

    关闭HttpClient日志的logback文件

    关闭HttpClient日志的logback文件

    用httpclient写的登录开心网

    标题中的“用httpclient写的登录开心网”表明我们将探讨如何使用Apache HttpClient库来实现对开心网的模拟登录。HttpClient是一个Java库,它提供了强大的HTTP客户端功能,包括发起HTTP请求、处理响应以及管理会话等...

    用HttpClient写了一个多线程下载软件

    标题中的“用HttpClient写了一个多线程下载软件”意味着我们将探讨如何使用Apache HttpClient库来创建一个支持多线程的文件下载应用。HttpClient是一个强大的Java库,它提供了丰富的HTTP客户端功能,包括请求发起、...

    HTTPCLIENT

    在这个主题中,我们将深入探讨HTTPCLIENT、日志(LOGGING)以及编码解码(CODEC)相关的知识点。 首先,我们来关注HTTPCLIENT。Apache HttpClient是Apache软件基金会的一个项目,它提供了一组API,用于实现客户端的...

    如何在WPF应用程序中通过HttpClient调用Web API

    在WPF(Windows Presentation Foundation)应用程序中,使用HttpClient调用Web API是一项常见的任务,尤其是在进行数据交互时。本文将深入探讨如何在WPF应用中利用HttpClient进行异步操作,以避免阻塞主线程,提高...

    HttpClient代理访问网络

    HttpClient代理访问网络

    httpclient官网教程中文版

    ### Httpclient官网教程中文版知识点总结 #### 一、引言 HTTP协议作为互联网的核心通信标准之一,在现代网络服务及物联网设备中扮演着至关重要的角色。随着技术的发展,越来越多的应用和服务依赖于HTTP协议来实现...

    httpclient

    《HttpClient:网络爬虫的核心工具》 HttpClient,作为Java领域中的一个强大库,是网络爬虫开发中的核心组件。它提供了丰富的API,使得开发者能够高效、灵活地进行HTTP请求的发送与响应的处理,从而实现数据的抓取...

    httpclient4.3中文教程

    HttpClient 4.3 是 Apache 开源组织提供的一个用于构建 HTTP 客户端应用程序的强大库,主要专注于 HTTP 协议的实现。它建立在 HttpCore 库之上,支持传统的阻塞 I/O 模型,适用于各种需要高效、可控的 HTTP 交互的...

    用httpclient-4.0-alpha2 打造基于http协议的网站分析器

    标题中的“用httpclient-4.0-alpha2 打造基于http协议的网站分析器”指的是一项使用Apache HttpClient库的版本4.0 alpha2来创建一个能够分析HTTP协议的工具或应用程序。HttpClient是一个Java库,它允许开发人员执行...

    用HttpClient来模拟浏览器GET_POST

    使用HttpClient来模拟浏览器GET_POST HttpClient是一个Apache开源组织中的项目,隶属于Jakarta的commons项目,旨在简化HTTP客户端与服务器进行各种通讯编程。通过使用HttpClient,可以轻松地解决以前很头疼的事情,...

    对于C#(HttpClient)方式网络请求的封装

    4. **超时设置**:可能会提到如何设置请求超时,以防止因服务器响应过慢导致程序阻塞。 5. **异步编程**:由于Unity游戏引擎推荐使用异步操作以避免阻塞主线程,所以会涉及使用async/await关键字来实现非阻塞的网络...

    HttpClient

    了解HttpClient类以及其对GZIP的支持,对于开发基于MFC的网络应用是非常有帮助的,它可以简化网络通信的复杂性,提高程序的效率。同时,熟悉WININET API和GZIP压缩原理也能增强对网络编程的理解。

    android HttpClient 获取网络图片

    android HttpClient 获取网络图片 实例

    httpclient.jar包下载

    《深入解析httpclient.jar及其与code.jar的关联》 在Java开发中,HTTP通信是不可或缺的一部分,而Apache HttpClient库正是Java实现HTTP客户端操作的重要工具。本文将深入探讨httpclient.jar包,以及它与code.jar包...

Global site tag (gtag.js) - Google Analytics