下载整个网站,可以使用下面的命令
wget-r -p -k -np http://[网址]
-r 表示递归下载,会下载所有的链接,不要单独使用这个参数,要加上 -np这个参数,表示不下载别的站点的链接.
-k表示将下载的网页里的链接修改为本地链接.
-p表示获得显示网页所需的元素,比如图片什么的.
另外还有其他的一些参数可以使用:
-c表示断点续传
-t 100表示重试100次,-t 0表示无穷次重试
另外可以将要下载的url写到一个文件中,每个url一行,使用这样的命令wget-i download_list.txt.
–reject=avi,rmvb 表示不下载avi,rmvb的文件,–accept=jpg,jpeg,表示只下载jpg,jpeg的文件.
可以在用户目录下建立一个.wgetrc 的文件(windows里面好像不能直接建立这样的文件,windows会认为没有文件名–),里面写上 http-proxy = 123.456.78.9:80,然后在加上参数 –proxy=on,如果需要密码,再加上下面的参数 –proxy-user=username, –proxy-passwd=password
# bearscafe Says:
03月 5th, 2008 at 1:30 pm
1、在bash shell中设定代理
.basrhc:
export http_proxy=”166.111.53A.167:3128〃
export ftp_proxy=”166.111.53A.167:3128〃
%DON‘T ask me why the proxy above is invaild, it’s just an example^_*
2、对于wget可以单独建立.wgetrc
http-proxy = 166.111.53.167:3128
ftp-proxy = 166.111.53.167:3128
3、用wget下载整个站点
#wget-k -m -np -d –proxy-user=usrname –proxy-passwd=passwd http://www.hq.nasa.gov/office/pao/History/SP-468/contents.htm
-k, –convert-links 将绝对链接转换为相对链接。
-m 就等价于 递归下载+除非远程文件较新,否则不再取回+最大递归深度无限+不删除“.listing”文件。
-np, –no-parent 不搜索上层目录。
注意其中-d只是输出下载信息,换成-q就变成“安静”下载了。
另外还有两个选项可能会有用到。
-b:让wget在后台运行
-c:断点续传
wget本身没有专门设置代理的命令行参数,但是有一个”-e”参数,可以在命令行上指定一个原本出现在”.wgetrc”中的设置。于是可以变相在命令行上指定代理:
wget-e “http_proxy=http://:/” http://www.google.com
另一个办法就是先设置环境变量:
set http_proxy=http://:/
今天无聊,下载了c-faq,总共下载时间用了13.5s,不得不佩服wget的强大.总有一天会看wget的源码的,最近.
分享到:
相关推荐
标题“使用wget下载整个网页”涉及的是一个网络爬虫工具——wget,它是一个在命令行环境中使用的开源工具,主要用于从互联网上下载文件或整个网站。本文将深入介绍wget的使用方法及其相关知识点。 wget,全称World ...
linux命令行模式使用wget下载JDK 版本 jdk-8u60-linux-x64.tar.gz
使用wget下载文件非常简单,基本语法如下: ```bash wget [选项] URL ``` 其中,URL是你要下载的文件的网络地址,选项则包括但不限于以下这些常见用法: - `-c` 或 `--continue`:续传功能,如果下载中断,可以继续...
在Windows 10上使用wget下载HTTPS链接文件,你需要先安装wget工具。通常,你可以从官方网站或者第三方软件仓库获取预编译的Windows版本。安装完成后,你可以在命令提示符(CMD)或者PowerShell中使用它。下载一个...
"Windows wget下载工具[winwget]" 是一个专为Windows操作系统设计的wget实现,wget是一款经典的命令行工具,主要用于从互联网上下载文件,尤其在Linux系统中广泛使用。winwget则是将wget的功能移植到了Windows平台,...
wget下载地址:https://ftp.gnu.org/gnu/wget/ 在wget的源代码中 src/url.c 这个文件中有wget如何处理文件名的函数url_file_name() url_file_name()在根据url的形式判断该保存为什么样的文件名,并进行了多方面的...
标题中的“Get cookies google 插件”指的是一个用于获取Google网站cookies的Chrome浏览器插件,它的主要作用是帮助用户在进行wget下载时更加便捷。wget是一个命令行工具,常用于在Linux系统中从互联网批量下载文件...
wget下载 VS2008 代码
windows下的wget下载工具!它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理. 所谓的自动下载是指,wget可以在用户退出系统的之后在后台执行。这意味这你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在...
在Windows操作系统中,`wget`是一个非常有用的命令行工具,用于从互联网上下载文件或整个网站。这个工具最初是为Linux系统开发的,但也可以在Windows环境下使用。本篇文章将详细讲解如何在Windows中安装和使用`wget`...
**wget网络多协议下载工具详解** wget是一款强大的网络下载工具,它被广泛应用于Linux系统中,同时也可跨平台运行在其他Unix-like系统上。wget以其可靠性和自动化特性著称,支持HTTP、HTTPS和FTP三种主要的互联网...
使用wget命令从清华源下载anaconda的安装脚本,结果返回403错误,无法下载。_-wget-403
`wget` 是一个在Linux和Unix-like操作系统中广泛使用的命令行网络下载工具,它允许用户非交互式地从Web服务器下载文件。尽管`wget`原生支持Unix环境,但随着Windows系统的普及,开发者也提供了`wget`的Windows版本,...
wget for ,通过CMD下载文件
`Wget`是一个强大的命令行下载工具,尤其适用于Linux系统,它可以用来批量下载网页、文件,甚至整个网站。以下是对`Wget`命令各部分参数的详细解释: **启动类参数** 1. `-V,--version`:显示`Wget`的版本信息,...
`wget` 是一款强大的互联网数据下载工具,支持多种选项来实现复杂的下载需求。在本文中,我们将深入探讨如何使用 `wget` 来下载整个网站或特定目录,以及它的一些高级特性,如代理下载、断点续传、递归下载等。 ###...
1. **基本用法**:最简单的wget命令格式为`wget [URL]`,这里的URL是你想要下载的文件地址。例如,`wget https://example.com/file.zip`会下载指定URL的file.zip文件。 2. **选项参数**:wget有许多可选参数来定制...
wget 是一个从网络上自动下载文件的自由工具,支持通过 HTTP、HTTPS、FTP 三个最常见的 TCP/IP协议 下载,并可以使用 HTTP 代理。Yum是一个在Fedora和RedHat以及CentOS中的Shell前端软件包管理器。基于RPM包管理,...
可以用批处理运行的Dos程序,功能强大,能够通过任务定时重复下载文件
Python中的`wget`模块是用于下载网页或文件的工具,其功能类似于命令行工具wget。在Python编程中,我们可以通过构建自己的脚本来模拟wget的功能,这通常涉及到HTTP、HTTPS等网络协议的处理以及文件的保存操作。下面...