wget下载整个网站
可以使用下面的命令 wget -r -p -k -np http://hi.baidu.com/phps , -r 表示递归下载,会下载所有的链接,不过要注意的是,不要单独使用这个参数,因为如果你要下载的网站也有别的网站的链接,wget也会把别的网站的东西下载 下来,由于互联网的特性,很有可能你会把整个互联网给下载下来 --,所以要加上 -np这个参数,表示不下载别的站点的链接. -k表示将下载的网页里的链接修改为本地链接.-p获得所以显示网页所需的元素,比如图片什么的.
另外还有其他的一些参数可以使用:
-c表示断点续传
-t 100表示重试100次,-t 0表示无穷次重试
另外可以将要下载的url写到一个文件中,每个url一行,使用这样的命令 wget -i download.txt.
--reject=avi,rmvb 表示不下载avi,rmvb的文件,--accept=jpg,jpeg,表示只下载jpg,jpeg的文件.
可以在用户目录下建立一个.wgetrc的文件(windows里面好像不能直接建立这样的文件,windows会认为没有文件名--),里面写上 http-proxy = 123.456.78.9:80,然后在加上参数 --proxy=on,如果需要密码,再加上下面的参数 --proxy-user=username, --proxy-passwd=password
转载地址:http://hi.baidu.com/phps/blog/item/a21dfeedfc0bba4f79f05532.html
分享到:
相关推荐
标题“使用wget下载整个网页”涉及的是一个网络爬虫工具——wget,它是一个在命令行环境中使用的开源工具,主要用于从互联网上下载文件或整个网站。本文将深入介绍wget的使用方法及其相关知识点。 wget,全称World ...
在本文中,我们将深入探讨如何使用 `wget` 来下载整个网站或特定目录,以及它的一些高级特性,如代理下载、断点续传、递归下载等。 ### 1. 下载整个网站或特定目录 要下载整个网站,可以使用 `-r` 参数进行递归...
对于下载整个网站,可以使用`-r`和`-p`选项,同时可能还需要指定递归深度和接受的文件类型,以避免下载不必要的内容。例如: ```bash wget -r -np -k -p http://example.com ``` 这会递归下载`http://example.com`...
- `-r`或`--recursive`:递归下载整个网站。 - `-P`或`--directory-prefix=DIR`:设定下载文件保存的目录。 - `-nH`或`--no-host-directories`:不创建基于主机名的目录结构。 - `-A`或`--accept=FILETYPE1,FILETYPE...
`wget` 的主要功能是能够非交互式地从互联网上下载文件或整个网站,这使得它在自动化任务和脚本中非常有用。它的优点在于即使网络连接不稳定,也可以通过断点续传的方式继续下载,确保大文件的完整获取。 使用 `...
- 使用`-r`参数时,wget会递归地下载指定URL下的所有文件和子目录,非常适合下载整个网站或特定目录下的所有资源。 - 示例:`$ wget -r http://example.com/` 将下载example.com网站的所有可访问资源。 2. **-np ...
- `-r`: 开启递归下载模式,即下载整个目录及其子目录中的文件。 - `-nd`: 不创建目录结构,即下载时不保留远程文件夹结构。 - `-nH`: 使用主机目录,下载时按照主机域名组织目录结构。 - `--cut-dirs=N`: 忽略前 N ...
`--recursive`或 `-r`选项使`wget`能够递归地下载整个网站。配合`--level`或 `-l`选项可以设置下载深度。 4. **镜像下载**: `--mirror`是`-r -N -l inf --convert-links --adjust-extension --page-requisites`...
wget支持HTTP HTTPS和FTP协议 可以使用HTTP代理 所谓的自动下载是指 wget可以在用户退出系统的之后在后台执行 这意味这你可以登录系统 启动一个wget下载任务 然后退出系统 wget将在后台执行直到任务完成 相对于其它...
下载整个目录 - **命令格式**:`wget -r [URL]` - `-r` 表示递归下载,即下载指定 URL 及其子目录下的所有文件。 - 示例:`wget -r ftp://10.8.8.8/movie/` - **注意事项**: - 默认情况下,`wget` 会保留远程...
它能够从互联网上下载文件、网页甚至整个网站,是进行非交互式下载的理想选择。在本场景中,我们将探讨如何利用wget进行数据的回传备份,以实现异地备份的重要功能。 **一、wget的基本用法** 1. **下载单个文件**...
4. **递归下载**:能够按照网站的目录结构下载整个站点的内容,非常适合备份网站或者下载论坛等场合。 5. **代理支持**:可以通过代理服务器进行下载。 6. **用户认证**:支持HTTP认证机制,即用户可以通过提供...
7. **使用wget**:现在,你可以使用`wget`命令从命令行下载文件,利用它的各种选项,如设置下载速度限制、断点续传、镜像整个网站等。 通过从源代码构建wget,用户可以获取最新版本,避免因地域限制导致的下载速度...
2. **递归下载**:通过指定参数,`wget` 可以按照网页链接的层级关系,递归地下载整个网站的页面、图片和其他资源,实现网站镜像。 3. **断点续传**:如果下载过程中网络中断,`wget` 可以记录当前位置并继续下载,...
它支持多种选项和参数,可以实现单个文件的下载、断点续传、递归下载整个目录甚至整个网站,以及通过代理服务器进行下载。下面我们将详细讲解这些功能及其用法。 1. **下载单个文件** 使用`wget`的基本语法是提供...
`wget`提供了一种递归下载的功能,允许用户复制整个网站。此功能通过`-r`或`--recursive`选项激活。例如,要递归下载一个网站的所有内容,可以使用如下命令: ```bash wget -r http://example.com ``` ### 转换链接...
2. 递归下载:使用`-r`选项可以进行递归下载,下载一个网页的时候连同其所有的链接一起下载,常用于下载整个网站的内容。配合`-p`可以下载所有显示内容所需的元素。 3. 转换到后台执行:`-b`选项允许wget在后台运行...
`-r` 或 `--recursive` 选项允许 wget 进行递归下载,常用于镜像整个网站。 ``` wget -r -p -k http://example.com ``` 其中,`-p` 表示下载页面所需的图片、CSS、JavaScript 等辅助文件,`-k` 会将链接转换为...
- `-r` 或 `--recursive`: 开启递归下载,适用于下载整个网站。 - `-l` 或 `--level`: 设置递归的最大深度,默认为5。 - `-A` 或 `--accept`: 指定接受的文件类型,例如`wget -A pdf http://example.com`只会下载PDF...