`
xubindehao
  • 浏览: 243882 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

mirror wget 镜像

阅读更多

先下载wget for windows ,随便放在一个目录。然后在“运行”里运行cmd,然后进入那个wget.exe所在的目录,接着就可以了……

直接输入wget,提示wget –help,按照帮助,输入,显示好多参数,直接定位到-r参数,也就是递归下载。恩,就是这个,马上输入:
wget -r [www.domains.com]
剩下的就是它事情了,它会自动在wget.exe的目录下建立一个www.domains.com 目录,也按照服务器的目录建立子目录。

它的其它一些参数如下(用法)[1]:
用法: wget [选项]… [URL]…
命令的引数使用长项目与短项目相同.
启动:
-V, –version显示Wget的版本并且离开.
-h, –help显示这个说明档.
-b, -background在启动之後跳到背景去.
-e, -execute=COMMAND执行一个`.wgetrc’里面的COMMAND指令.
纪录档与输入的档案:
-o, –output-file=FILE纪录讯息到FILE去.
-a, -append-output=FILE增加讯息到FILE去.
-d, –debug显示除错的输出.
-q, –quiet安静模式(不输入任何讯息).
-v, –verbose冗长模式(这是内定值).
-nv, –non-verbose关闭verboseness,但不是安静模式.
-i, –input-file=FILE从FILE读取URL .
-F, –force-html把输入的档案当作HTML.
下载:
-t, –tries=NUMBER设定重复尝试NUMBER次(0是无限制).
-O –output-document=FILE把文件写到FILE里.
-nc, –no-clobber不破坏已经存在的档案.
-c, –continue重新取得一个已经存在的档案.
–dot-style=STYLE设定取回状况的显示风格.
-N, –timestamping不取回比本地旧的档案.
-S, –server-response显示伺服器回应状况.
–spider不下载任何东西.
-T, –timeout=SECONDS设定读取时超过的时间为SECONDS秒.
-w, –wait=SECONDS在取回档案时等待SECONDS秒.
-Y, –proxy=on/off开启或关闭Proxy.
-Q, –quota=NUMBER设定取回档案的定额限制为NUMBER个.
目录:
-nd –no-directories不建立目录.
-x, –force-directories强制进行目录建立的工作.
-nH, –no-host-directories不建立主机的目录.
-P, –directory-prefix=PREFIX把档案存到PREFIX/…
–cut-dirs=NUMBER忽略NUMBER个远端的目录元件.
[HTTP选项:]
– [http-user=USER设http使用者为USER.]
– [http0passwd=PASS设http使用者的密码为PASS.]
-C, –cache=on/off提供/关闭快取伺服器资料(正常情况为提供).
–ignore-length忽略`Content-Length’标头栏位.
–proxy-user=USER设USER为Proxy使用者名称.
–proxy-passwd=PASS设PASS为Proxy密码.
-s, –save-headers储孠[HTTP标头成为档案.]
-U, –user-agent=AGENT使用AGENT取代Wget/VERSION作为识别代号.
FTP选项:
–retr-symlinks取回FTP的象徵连结.
-g, –glob=on/off turn file name globbing on ot off.
–passive-ftp使用”passive”传输模式.
使用递回方式的取回:
-r, –recursive像是吸入web的取回–请小心使用!.
-l, –level=NUMBER递回层次的最大值(0不限制).
–delete-after删除下载完毕的档案.
-k, –convert-links改变没有关连的连结成为有关连.
-m, –mirror开启适合用来映射的选项.
-nr, –dont-remove-listing不要移除`.listing’档.
递回式作业的允许与拒绝选项:
-A, –accept=LIST允许的扩充项目的列表.
-R, –reject=LIST拒绝的扩充项目的列表.
-D, –domains=LIST允许的网域列表.
–exclude-domains=LIST拒绝的网域列表(使用逗号来分隔).
-L, –relative只跟随关联连结前进.
–follow-ftp跟随HTML文件里面的FTP连结.
-H, –span-hosts当开始递回时便到外面的主机.
-I, –include-directories=LIST允许的目录列表.
-X, –exclude-directories=LIST排除的目录列表.
-nh, –no-host-lookup不透过DNS查寻主机.
-np, –no-parent不追朔到起源目录.

 

 

wget 是linux下的一个非常强大的下载命令行工具。
这里有它的windows版本,http://users.ugent.be/~bpuype/wget/

这样,windows的用户,也可以使用这个强大的命令行工具了。结合批处理文件,这个东东可以完成很多连flashget等都无法完成的功能哦。

wget本身也有很多不错的功能,比如:

wget -mr http://...         
通过递归取得整站镜像

wget -mrnp http://...      
和上面差不多,但是递规时,不考虑外部服务器的链接
wget -k http://users.ugent.be/~bpuype/wget  
取得一个html文件,并且,将相对链接改为绝对地址 wget -c http://...
续传
wget -i file_with_urls.txt 从外部文件加载下载任务

[Ref.]
[1]wget参数使用参考 [www.21ds.net]
[2]wget project [www.gnu.org]

 

 

 

 

eg:wget -c -r -np -k -L http://mirrors.sohu.com/ebook/

分享到:
评论

相关推荐

    centos下wget安装包

    对于网络管理员和开发者来说,`wget`的一个强大特性是它可以递归下载整个网站或目录,只需使用`--mirror`选项: ```bash wget --mirror --convert-links --adjust-extension --page-requisites --no-parent ...

    【超级好用】wget win10 解压直接用

    3. **镜像下载**:wget可以用于完整镜像网站,`wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://example.com/`将下载整个网站到本地。 4. **HTTP和FTP协议**:wget支持...

    wget-1.14-15.el7.x86_64.rpm

    4. **镜像下载**:`-m`或`--mirror`选项结合递归下载,用于创建目标网站的本地镜像。 5. **时间戳**:`-N`或`--timestamping`选项只更新比本地文件新的或不存在的文件。 6. **HTTP/HTTPS代理**:`--proxy=on`和`--...

    Android 终端上可以使用的完全版本wget

    此外,wget还可以通过使用`--mirror`选项进行网站镜像,`--user`和`--password`进行基本认证,以及`--no-check-certificate`跳过SSL证书验证等。 在Android开发或系统管理中,这样的完整版wget可以极大地提高效率,...

    wget_windows_wget_Vc_

    例如,使用`wget --mirror -p -np -k http://example.com`可以镜像整个网站到本地。 7. **注意问题**:由于是使用VC6编译,可能存在与较新Windows系统不兼容的问题,如缺少库文件、不支持新的API等。在使用时,需要...

    wget官方最新文档

    - **镜像下载**:`-m`或`--mirror`选项可以创建网站的完整镜像,包括重定向、保持原始时间戳和权限等。 - **HTTP/HTTPS/FTP支持**:可以处理基本的HTTP请求,还支持安全的HTTPS和文件传输FTP协议。 - **认证和代理**...

    wget网络多协议下载

    `--mirror`选项结合递归下载,可以创建源网站的镜像。这通常用于备份或离线浏览网站。 ### 7. wget-1.5.3版本 `wget-1.5.3`是wget的一个具体版本,可能包含了特定的功能改进和修复。每个版本的wget都有可能在前一...

    wget 32位版本

    4. **递归下载**:`wget` 提供递归下载功能,可以下载整个网站或目录结构,这对于备份网站或镜像站点非常有用。 5. **时间戳比较**:在更新已存在的本地文件时,`wget` 可以检查远程文件的时间戳,只有当远程文件...

    wget的完整代碼

    使用`-m`或`--mirror`选项可以镜像整个网站: ``` wget -m http://example.com ``` 6. **递归下载**: 没有-m但想递归下载,可以结合`-r`或`--recursive`: ``` wget -r http://example.com ``` 7. **限制...

    下载工具WGET x64

    - **镜像下载**:WGET可以创建网站的完整镜像,使用`--mirror`选项。 - **递归下载**:结合`-r`或`--recursive`,可以递归地下载整个目录结构。 - **用户代理伪装**:使用`--user-agent`选项可以模拟不同的浏览器或...

    windows下wget命令

    - **镜像下载网站**: `--mirror`或 `-m`选项可以镜像整个网站。注意可能涉及版权和使用政策问题。 - **处理HTTP响应代码**: `--http-status-error=range`允许根据HTTP响应代码决定是否错误处理。例如:`wget --...

    解决wget无法使用的方法

    rpm -Uvh --force http://mirror.centos.org/centos-7/7/os/x86_64/Packages/centos-release-7-6.1810.2.el7.centos.x86_64.rpm ``` - 这个命令会强制更新镜像源,确保使用的是最新版本。 - **步骤三**:验证新...

    wget详细使用说明

    wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://example.com ``` 这将完整下载http://example.com网站,包括所有图片、CSS和JavaScript,并转换内部链接使其可以在本地...

    wget 1.194 win64

    - **镜像下载**:`wget -r`或`wget --mirror`可以递归地下载整个网站,用于创建网站的本地镜像。 - **时间戳**:`wget --timestamping`只下载比本地新或者不存在的文件,避免重复下载。 - **用户代理伪装**:`...

    解决wget无法使用

    - 执行以下命令来添加官方CentOS 7的镜像源: ``` rpm -Uvh --force http://mirror.centos.org/centos-7/7/os/x86_64/Packages/centos-release-7-6.1810.2.el7.centos.x86_64.rpm ``` 3. **验证新软件源**: -...

    wget_wget_

    4. **镜像下载**:使用`-m`或`--mirror`选项可以镜像整个网站,这对于备份或者离线浏览非常有用。 5. **递归下载**:结合`-r`或`--recursive`选项,wget可以递归地下载指定目录下的所有链接,通常配合`--level`设定...

    网络爬虫wget-简单易行

    2. **镜像下载**:`-m` 或 `--mirror` 参数结合递归下载,可以创建目标网站的完整镜像,常用于备份或离线浏览。 3. **用户代理伪装**:通过`--user-agent` 参数,你可以指定wget模拟不同的浏览器或用户代理,这对于...

    wget windows版本

    - **镜像下载**:`wget --mirror --convert-links --adjust-extension --page-requisites http://example.com`,这会下载整个网站并保存为本地镜像。 - **设置代理**:如果需要通过代理服务器下载,可以使用`--proxy...

    使用wget下载整个网页

    3. **配置递归下载**:要下载整个网站,需要使用`--mirror`选项,这会告诉wget进行镜像下载,包括递归获取链接页面。同时,可以使用`--level`或`-l`参数设置递归深度。 4. **指定保存路径**:使用`-P`或`--...

    wget-1.18-win64.zip

    2. **递归下载**: 使用`--mirror`或`-m`选项,可以镜像一个网站的所有链接。 3. **断点续传**: `--continue`或 `-c`选项允许在中断后继续下载。 4. **时间戳比较**: `--timestamping`或 `-N` 可以检查本地文件的...

Global site tag (gtag.js) - Google Analytics