论坛首页 Java企业应用论坛

自己倒腾的一个小的HTTP小工具

浏览 10810 次
精华帖 (0) :: 良好帖 (3) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2011-02-10  
源码可以share吗?
想了解下细节,谢谢!
0 请登录后投票
   发表时间:2011-02-11  
楼主可否分享下源码?谢谢
0 请登录后投票
   发表时间:2011-03-01  
ld57601870 写道
楼主可否分享下源码?谢谢

反编译下 不就结了
0 请登录后投票
   发表时间:2011-03-08  
同求细节~谢谢~
0 请登录后投票
   发表时间:2011-03-19  
呵呵 抓取网页源码啊 瞧瞧啊!
0 请登录后投票
   发表时间:2011-07-07  
今天 特来看看lz在cookie上怎么管理的,杯具的是附件没在了,有木有~~~
0 请登录后投票
   发表时间:2011-07-07  
DAOException 写道
jkvast 写道
DAOException 写道
evil9999 写道
如何实现自动识别网页字符集
在head里面的meta头里面有个charset属性,一般这个都是较为准确的字符编码属性,http响应头当中的未必正确。在接收字符串的时候,去识别该属性值,从而对获取的源码进行编码转换,


    额,我也做过一点时间的网页采集工作,但经常发现请求头返回的charset也有大部分网站是不正确的,好像asp。net的网站居多,网上找了半天关于判断字符窜的编码,都不是很好,不知楼主有没有什么好的方法;
    另一方面,关于效率问题,和URLConnection有没有做个比较呢。

    呵呵,Java的HttpClient倒是很熟悉,但感觉不太轻便,很多东西没用,速度也慢,看了楼主封装的挺好的,简洁实用,没注意看是否支持multipart的,(最近我也封装了个c++版本的,自己感觉还行,只是没有楼主这么封得怎么底层,哈哈,有时间研究下,楼主的代码)


    请求头里面的不正确的比较多,在html源代码里面的meta头里面的正确率比较高。我这里其实也就是对socket和http协议做了一个简单的封装,能简单则简单,毕竟只做了一天多点的成果。multipart暂时不支持,不过有时间可以考虑加进去。
    有时间可以交流交流哈。我的还比较简单。


只有在服务器端指定 才能获得

<%@ page language="java" contentType="text/html; charset=UTF-8"    pageEncoding="UTF-8"%>


response.setContentType("text/html; charset=UTF-8");



获取html的编码可以通过正则匹配获得
<meta.*charset=\s?(\w+-?\w+)?



0 请登录后投票
   发表时间:2011-07-07  
怎么没看到附件?
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics