锁定老帖子 主题:自己倒腾的一个小的HTTP小工具
精华帖 (0) :: 良好帖 (3) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2011-02-10
源码可以share吗?
想了解下细节,谢谢! |
|
返回顶楼 | |
发表时间:2011-02-11
楼主可否分享下源码?谢谢
|
|
返回顶楼 | |
发表时间:2011-03-01
ld57601870 写道 楼主可否分享下源码?谢谢
反编译下 不就结了 |
|
返回顶楼 | |
发表时间:2011-03-08
同求细节~谢谢~
|
|
返回顶楼 | |
发表时间:2011-03-19
呵呵 抓取网页源码啊 瞧瞧啊!
|
|
返回顶楼 | |
发表时间:2011-07-07
今天 特来看看lz在cookie上怎么管理的,杯具的是附件没在了,有木有~~~
|
|
返回顶楼 | |
发表时间:2011-07-07
DAOException 写道 jkvast 写道 DAOException 写道 evil9999 写道 如何实现自动识别网页字符集 在head里面的meta头里面有个charset属性,一般这个都是较为准确的字符编码属性,http响应头当中的未必正确。在接收字符串的时候,去识别该属性值,从而对获取的源码进行编码转换,额,我也做过一点时间的网页采集工作,但经常发现请求头返回的charset也有大部分网站是不正确的,好像asp。net的网站居多,网上找了半天关于判断字符窜的编码,都不是很好,不知楼主有没有什么好的方法; 另一方面,关于效率问题,和URLConnection有没有做个比较呢。 呵呵,Java的HttpClient倒是很熟悉,但感觉不太轻便,很多东西没用,速度也慢,看了楼主封装的挺好的,简洁实用,没注意看是否支持multipart的,(最近我也封装了个c++版本的,自己感觉还行,只是没有楼主这么封得怎么底层,哈哈,有时间研究下,楼主的代码) 请求头里面的不正确的比较多,在html源代码里面的meta头里面的正确率比较高。我这里其实也就是对socket和http协议做了一个简单的封装,能简单则简单,毕竟只做了一天多点的成果。multipart暂时不支持,不过有时间可以考虑加进去。 有时间可以交流交流哈。我的还比较简单。 只有在服务器端指定 才能获得 <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> response.setContentType("text/html; charset=UTF-8"); 获取html的编码可以通过正则匹配获得 <meta.*charset=\s?(\w+-?\w+)? |
|
返回顶楼 | |
发表时间:2011-07-07
怎么没看到附件?
|
|
返回顶楼 | |