`
liudaoru
  • 浏览: 1588291 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用wget获取一个需要登陆的页面

阅读更多

应用判断是否一个用户是否登录主要是通过cookie,而浏览器最终发给服务器的是一个标准的http头,比如下面的:

 

GET /pc/myInfo HTTP/1.1

Accept: */*

Accept-Language: zh-cn

UA-CPU: x86

Accept-Encoding: gzip, deflate

User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; CIBA; InfoPath.2)

Host: wenda.sogou.com

Connection: Keep-Alive

Cookie: SUID=aifGPyes

 

wget支持 –head 的方式将这个请求拼出来,所以我们就可以构造一个下面的http请求:

 

wget --head "Accept: */*" --head "Accept-Language: zh-cn" --head "Accept-Encoding: gzip, deflate" --head "User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; CIBA; InfoPath.2)" --head "Host: wenda.sogou.com "-head "Connection: Keep-Alive" --head "Cache-Control: no-cache" --head "Cookie: SUID=aifGPyes" http://wenda.sogou.com/pc/myInfo

 

这样就可以获取需要登陆的内容了。

1
0
分享到:
评论
2 楼 liudaoru 2009-05-07  
感谢《wget 破除http header下载禁止》,http://www.diybl.com/course/1_web/webjs/2007111/81739.html

1 楼 liudaoru 2009-05-07  

相关推荐

    使用wget下载整个网页

    3. **配置递归下载**:要下载整个网站,需要使用`--mirror`选项,这会告诉wget进行镜像下载,包括递归获取链接页面。同时,可以使用`--level`或`-l`参数设置递归深度。 4. **指定保存路径**:使用`-P`或`--...

    wget详细使用说明

    你可以指定一个文件名来保存下载内容,而不是使用URL中的文件名。例如: ```bash wget -O myfile.txt http://example.com/somefile.txt ``` 这将下载的文件重命名为myfile.txt。 **-nH 或 --no-host-directories**...

    页面抓取工具wget-1.11.4b.zip

    在标题"页面抓取工具wget-1.11.4b.zip"中,"wget"是主要关键词,版本号"1.11.4b"表明这是wget的一个特定版本,可能包含了该版本特有的优化或修复。而"zip"则表示这是一个压缩文件,通常包含wget的源代码、编译好的二...

    wget网站下载工具

    总之,wget是一个功能强大的下载工具,它提供了丰富的选项以满足各种下载需求,无论是单个文件还是整个网站,无论是正常下载还是在网络受限的环境中,wget都能胜任。熟练掌握wget的使用,可以极大地提高你在处理网络...

    wget使用方法

    `wget`是一个强大的开源命令行工具,用于在Linux和Unix-like操作系统中下载互联网上的资源。它支持HTTP、HTTPS和FTP协议,甚至可以通过代理服务器工作。`wget`的特点在于其非交互式操作,可以在后台运行,即便用户...

    wget-1.20.3-win64.zip

    `wget-1.20.3-win64.zip` 是一个专门为 Windows x64 平台设计的 wget 工具的压缩包。wget 是一款强大的命令行网络下载工具,广泛应用于Linux系统,但这个版本是为64位的Windows用户准备的。它支持通过HTTP、HTTPS和...

    获取本地IP外网IP

    这个命令会静默地(-q)从`https://ifconfig.co`获取页面内容,并输出到标准输出(-O-),然后使用`findstr`命令查找包含“”的部分,通常公网IP会被包含在这个标签内。 为了将这些命令集成到批处理文件中,你可以...

    wget命令行下载工具

    `wget`命令行下载工具是Linux...总结起来,`wget`是一个功能强大的下载工具,尤其适用于需要自动化、批处理或离线浏览的场景。通过灵活的选项和配置,用户可以根据具体需求定制其行为,以适应各种复杂的网络下载任务。

    wget源吗

    wget 是 Linux 系统中的一款强大且广泛使用的命令行下载工具,它支持 FTP、HTTP 和 HTTPS 等多种协议,可以实现后台下载、断点续传等功能,尤其适用于在没有图形化界面的服务器环境中进行文件下载。wget 的名称来源...

    Get cookies google 插件,使用特别方便,以后wget下载

    标题中的“Get cookies google 插件”指的是一个用于获取Google网站cookies的Chrome浏览器插件,它的主要作用是帮助用户在进行wget下载时更加便捷。wget是一个命令行工具,常用于在Linux系统中从互联网批量下载文件...

    wget官方文档.pdf

    ### Wget工具详解 #### 一、概述 **wget** 是一个用于非...综上所述,**wget**不仅是一个强大的下载工具,也是一个灵活多变的网络爬虫框架的基础。通过合理的配置和使用,它可以极大地提高文件下载效率和自动化程度。

    wget-windows

    3. **镜像功能**:wget可以完全复制一个网站到本地,包括所有链接的页面和资源,这对于备份网站或者离线浏览非常有用。 4. **递归下载**:可以设置深度限制,让wget沿着网页链接逐级下载,非常适合下载大型网站结构...

    Win32版Wget1.15命令帮助

    **Win32版Wget1.15命令帮助** wget是一款功能强大的开源网络数据下载...在使用过程中,如果遇到问题,可以通过`wget --help`或查阅相关文档获取更多帮助。了解并熟练掌握这些命令,将极大地提升你的网络资源管理效率。

    wget_ForWindows 单文件版本

    这个“wget_ForWindows 单文件版本”提供了方便的 Windows 平台兼容性,以一个单独的 `.exe` 文件形式存在,无需额外安装过程,易于复制和在 DOS(命令提示符)环境下或批处理脚本中使用。 以下是对 `wget` 的详细...

    wget 网站搬家工具

    总的来说,`wget` 是一个功能强大且灵活的下载工具,尤其适用于需要离线浏览网站或者进行批量下载的场景。通过熟练掌握 `wget` 的使用,IT从业者可以大大提高工作效率,尤其是在网络环境不稳定或者需要自动化下载...

    wget-1.11.3.tar.gz

    `wget-1.11.3.tar.gz`是一个源代码压缩包,其中包含了wget工具的1.11.3版本。`tar.gz`是Linux下常用的文件打包格式,它首先使用tar工具将多个文件或目录打包成一个文件,然后用gzip工具进行压缩,以减少存储空间。 ...

    使用wget递归镜像网站

    在互联网技术领域中,`wget`是一个极其强大的命令行工具,被广泛用于从Web上下载文件。它不仅能够处理单一文件的下载,还支持复杂的递归下载模式,这对于复制整个网站或创建站点的镜像来说非常有用。 #### wget命令...

    wget.exe cmd下载网络图片

    3. **批量下载**:如果你有多个图片链接,可以创建一个包含这些链接的文本文件,然后使用`wget`的`-i`或`--input-file`参数批量下载: ``` wget -i "链接文件.txt" ``` 4. **静默模式**:在某些情况下,你可能...

    centos5下 wget-1.13.tar.gz

    在本案例中,我们讨论的是`wget`的一个特定版本——`wget-1.13.tar.gz`,这是一个在CentOS 5操作系统环境下使用的版本。`wget-1.13.tar.gz`是一个源代码包,通常在Linux发行版的官方仓库中找不到较旧的版本,因此...

Global site tag (gtag.js) - Google Analytics