wget不仅能抓取某个页面,还能对网站做镜像,貌似很不错。这个不就是爬虫吗?而且速度也很快,用来抓取网页格式的文档是不错的。
让我们看这条命令:
wget --mirror –w 2 –p --HTML-extension –-convert-links –P ~\wget_files\example1 http://www.yourdomain.com
- --mirror(-m):指定要做镜像的网站。wget会获取网站的所有链接和相关的文件。如果本地镜像存在,还会自动覆盖最近的更新。
- -w:告诉wget每个请求的间隔时间,这里是2秒。这个不是必需的,当有些站点对请求间隔有限制时,这个参数就非常有用了。
- -p:让wget获取页面上的所有元素,使其能在本地浏览。--mirror参数并不会保证所有的图片及相关文件都被下载,所以需要加上-p来指定。
- --HTML-extension:将所有不是html扩展名的文件都转换成.html。这个参数会把CGI,ASP,PHP等结尾的文件都转换成html结尾。
- -P(prefix folder):指定目标文件夹。
还可以备份ftp:
wget –mirror –w 3 –p –P ~\wget_files\example2 ftp://username:password@ftp.yourdomain.com
当然下载文件更没问题了:
Wget –P c:\wget_files\example3 http://ftp.gnu.org/gnu/wget/wget-1.9.tar.gz
不过备份站点的话,可能用rsync更好的一点吧。
分享到:
相关推荐
`wget`是一个强大的命令行下载工具,主要用于在Unix-like操作系统(包括Linux和macOS)上从互联网上下载文件。它的名字是“World Wide Web”和“get”的组合,表明其主要功能是从Web获取文件。`wget`的特点在于其非...
Python中的`wget`模块是用于下载网页或文件的工具,其功能类似于命令行工具wget。在Python编程中,我们可以通过构建自己的脚本来模拟wget的功能,这通常涉及到HTTP、HTTPS等网络协议的处理以及文件的保存操作。下面...
windows下的wget下载工具!它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理. 所谓的自动下载是指,wget可以在用户退出系统的之后在后台执行。这意味这你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在...
在Linux系统中,`wget`是一个非常实用的命令行工具,用于从互联网上下载文件,尤其在没有图形化界面或者网络连接不稳定的情况下,其离线安装就显得尤为重要。本篇文章将详细阐述如何在Linux环境下离线安装`wget`,...
相比较初代 GNU Wget,Wget2 速度更快,支持更多的协议,特别是围绕 HTTP/2 和压缩,支持多线程/并行连接,以及其他改进。 GNU Wget2 2.0 增加了 HTTP2 上传,通过新的 -download-attr 选项支持 HTML5 下载属性,...
在Linux操作系统中,`wget`是一个非常实用的命令行工具,用于从互联网上下载文件。它支持HTTP、HTTPS和FTP协议,甚至可以通过代理服务器进行下载。`wget`的一个显著特点是其非交互式操作,能够在后台运行,非常适合...
wget1.21.4.zip安装包是一款包含wget 1.21.4版本的可执行文件的压缩包。wget是互联网上广泛使用的命令行工具,用于从Web服务器上下载文件,尤其适用于非交互式环境,例如自动化脚本或计划任务。这个版本1.21.4可能是...
本文将详细介绍如何在CentOS虚拟机上离线安装wget及其依赖包。 首先,让我们理解一下wget的基本概念。wget是一款强大的网络下载工具,它支持通过HTTP、HTTPS和FTP协议下载,并且可以在用户退出后继续之前的下载任务...
在Windows操作系统中,虽然不像Linux那样内置了wget命令行工具,但用户仍然可以通过一些方法来实现类似的功能。wget是一款强大的互联网资源下载工具,它支持通过HTTP、HTTPS和FTP协议从命令行界面下载网页内容,包括...
在这种情况下,你需要一个完整功能的wget版本,这就是"Android终端上可以使用的完全版本wget"的由来。 wget是一款强大的非交互式网络下载工具,广泛应用于Linux和Unix系统,同时也适用于Android这样的移动平台。它...
wget是Linux系统中一个强大的命令行工具,用于从互联网上下载文件。它的全名是“World Wide Web Get”,顾名思义,它可以从万维网上抓取文件,无论是单个文件还是整个网站。wget以其非交互式、后台运行以及断点续传...
在wget的源代码中 src/url.c 这个文件中有wget如何处理文件名的函数url_file_name() url_file_name()在根据url的形式判断该保存为什么样的文件名,并进行了多方面的考虑,最终该函数调用了append_uri_pathel(),该...
wget是一个很好的网络下载工具,linux环境下功能强大,可以探测url状态,此款工具是windows环境下的wget.exe 下载以后可以存放到system32目录下方便调用。
Window10中的wget工具是一个非常实用的命令行工具,它允许用户从互联网上下载文件,类似于Linux环境下的wget命令。这个wget包适用于那些在Windows环境下需要进行自动化或非交互式下载任务的用户。通过解压提供的...
wget是Linux系统中一个常用的命令行工具,用于从互联网上下载文件。在Windows平台上,由于其默认不支持wget,因此需要通过编译或者其他方式获取Windows版本。本资源提供了在Windows环境下,使用Visual C++ 6(简称VC...
`wget` 是一款功能强大的命令行下载工具,尤其在Linux环境中广泛使用,但同样适用于Windows系统。本主题主要关注32位版本的`wget`,它允许用户通过命令行界面进行高效、灵活的互联网资源下载。 `wget` 的主要特点...
wget.exe 是一个命令行工具,主要用于在Windows操作系统中下载网页、文件和其他互联网资源。它源自于开源的GNU项目,功能强大且高度可配置,适用于自动化批量下载任务。wget支持HTTP、HTTPS和FTP协议,同时也能够...
`wget` 是一个非常强大的命令行工具,用于从互联网上下载文件和整个网站。它支持HTTP、HTTPS和FTP协议,并且可以处理代理服务器、cookies、认证等复杂情况。`wget` 的灵活性和可靠性使其在系统管理员和开发者中广受...
wget是Linux环境中广泛使用的命令行工具,用于从网络上下载文件。这个“wget源码安装包1.20版lz gz”指的是wget的1.20版本源代码,压缩格式为lz和gz,通常这样的文件扩展名组合表示文件已经被lz(LZMA,一种高效的...
"win32_wget"是一个专为Windows 32位操作系统设计的版本,它基于开源的网络下载工具wget。wget是互联网上广泛使用的命令行工具,用于非交互式下载网络上的文件,支持HTTP、HTTPS和FTP协议,以及通过HTTP代理进行下载...