`

wget 使用技巧

阅读更多

转载自:http://blog.163.com/lgh_2002/blog/static/44017526200911103111721/

 

wet是一个命令行的下载工具。对于我们这些 Linux 用户来说,几乎每天都在使用它。下面为大家介绍几个有用的 wget 小技巧,可以让你更加高效而灵活的使用 wget。

  • $ wget -r -np -nd http://example.com/packages/

这条命令可以下载 http://example.com 网站上 packages 目录中的所有文件。其中,

-np

的作用是不遍历父目录,

-nd

表示不在本机重新创建目录结构。

  • $ wget -r -np -nd --accept=iso http://example.com/centos-5/i386/

与上一条命令相似,但多加了一个

--accept=iso

选项,这指示 wget 仅下载 i386 目录中所有扩展名为 iso 的文件。你也可以指定多个扩展名,只需用逗号分隔即可。

  • $ wget -i filename.txt

该命令常用于批量下载的情形,把所有需要下载文件的地址放到 filename.txt 中,然后 wget 就会自动为你下载所有文件了。

  • $ wget -c http://example.com/really-big-file.iso

这里所指定的

-c

选项的作用为断点续传。

  • $ wget -m -k (-H) http://www.example.com/

该命令可用来镜像一个网站,wget 将对链接进行转换。如果网站中的图像是放在另外的站点,那么可以使用

-H

选项。

wget --spider 看返回值L
       如: 200 304 403 404 ...

HTTP request sent, awaiting response... 200 OK
       Length: 1,494 [text/html]
       200 OK

HTTP request sent, awaiting response... 404 Not Found
       17:41:50 ERROR 404: Not Found.

 

最常見的使用方式:

1. 下載某檔案

wget http://xxx.xxx.xxx.xxxx/file.tar.gz

2. 砍站(類似teleport pro)

 

wget -r http://xxx.xxx.xxx.xxxx/

3. 砍站無視robots.txt檔案 , 我想這才是您想知道的吧..

   在告訴您之前,請想想robots.txt的用途, 以及為何管理者設了這個東西.

   以及您無視robots.txt後 對網站及管理造成的負擔/困擾...

   我先說我的處理方式:

   心情好時,無視此行為,反正網站就是要給你看的..

   心情差時,拒絕該區段ip連線,例如: 163.19.163.99 砍站, 我就拒絕 163.19.163.0/24 .

   甚者...拒絕該ip所屬isp或是所屬國家所有區段.

 

wget -erobots=off http://xxx.xxx.xxx.xxxx/

實測: 當沒有加上 -erobots=off 只會抓取網頁的首頁及robots.txt ,若加上,則會進行砍站動作.

4. 若對方網站拒絕Wget...

wget -m -U "Mozilla/5.0 (compatible; Konqueror/3.2; Linux)" http://xxx.xxx.xxx.xxx

則可以偽裝為其他瀏覽器...

分享到:
评论

相关推荐

    wget使用技巧(方便有用的参数)

    ### wget使用技巧详解 在日常工作中,熟练掌握wget这一强大的命令行工具,能够极大地提高工作效率,简化复杂的网络文件下载过程。本文将深入探讨wget的使用技巧,特别关注那些平日里可能被忽视但极其实用的参数,...

    Wget使用方法.txt

    #### 三、进阶使用技巧 ##### 1. 下载整个目录 - **命令格式**:`wget -r [URL]` - `-r` 表示递归下载,即下载指定 URL 及其子目录下的所有文件。 - 示例:`wget -r ftp://10.8.8.8/movie/` - **注意事项**: ...

    解决wget无法使用的方法

    ### 解决wget无法使用的方法 在Linux环境中,`wget`是一个非常重要的工具,它用于从网络上下载文件。然而,在某些情况下,用户可能会遇到`wget`无法使用的问题。本文将详细探讨这一问题,并提供一系列解决方案。 #...

    windows 使用wget 下载命令

    本篇文章将详细讲解如何在Windows中安装和使用`wget`,以及相关的使用技巧。 **一、wget的安装** 在Windows上使用`wget`,首先需要获取对应版本的可执行文件。在提供的压缩包中,我们有一个名为`WGET64.EXE`的文件...

    离线安装wget依赖包

    7. **验证安装**:安装完成后,使用`wget --version`来验证wget是否成功安装并且可以正常工作。 离线安装的过程中可能会遇到依赖关系冲突,如果出现这种情况,你可能需要手动查找并安装缺失的依赖。此外,确保你...

    python_wget

    以上就是使用Python实现wget功能的一些基本步骤和技巧。在实际应用中,你可能需要根据具体需求进行扩展,比如处理HTTPS证书验证、处理cookies、或者支持断点续传等高级特性。而压缩包中的`wget-3.2`可能是wget工具的...

    wget-1.19.4

    总的来说,wget-1.19.4为Windows用户提供了强大的下载工具,通过熟悉和掌握其使用技巧,可以在没有图形界面的环境下高效地进行文件下载任务。同时,理解并配置环境变量是使用这个工具的先决条件,而提供的文件如...

    网络爬虫wget-简单易行

    wget是互联网上广泛使用的命令行工具,用于非交互式下载网络上的文件。它以其简单、高效和可定制性而受到许多程序员和数据分析师的青睐。wget是GNU项目的一部分,可以在各种操作系统上运行,包括Linux、Unix、Mac OS...

    wget[exe&help]

    `wget`是一个强大的网络资源下载工具,它支持多种操作系统,包括Windows XP和各种Linux发行版。这个工具的主要功能是能够从互联网上下载文件、...记住,`wget`的灵活性和强大功能意味着它总是有新技巧等待你去发掘。

    wget-1.12-1.4.el6.x86_64.zip

    总之,在Linux环境中安装特定版本的wget,需要克服依赖性问题和可能的版本冲突,通过正确使用包管理器的选项或从源代码编译,可以成功安装并使用所需版本。在日常工作中,理解这些技巧对于管理和维护系统非常重要。

    wget源吗

    **wget 源码安装详解** wget 是 Linux 系统中的一款强大且广泛使用的命令行下载工具,它支持 FTP、HTTP 和 ...对于网络管理员、开发者或是需要频繁下载文件的用户来说,熟练掌握 wget 的使用技巧是非常有帮助的。

    前端开源库-wget-improved

    在探索`wget-improved`的更多功能时,建议查看其官方文档和源代码,了解所有可用的选项和使用技巧。 **总结** `wget-improved`作为一个优化过的前端开源库,为Node.js开发者提供了更强大和灵活的文件下载能力。它...

    Windows32 wget.exe&curl;.exe 命令行下载工具(附dll文件)

    这两个HTML文件可能是相关教程或资源列表,帮助用户了解更多的服务器管理和网络工具,或者是关于wget和curl的进阶使用技巧。访问这些文件可以扩展你的知识面,提升你在服务器管理领域的技能。 总的来说,这个压缩包...

    WGET源码 c/c++

    学习WGET的源码,开发者可以了解网络编程的细节,理解HTTP和FTP协议的实现,掌握跨平台编程技巧,以及如何设计一个健壮的下载工具。这不仅有助于提升C/C++编程能力,也有助于对网络服务和客户端交互有更深入的理解。...

    官网64位免安装wget

    wget是Linux系统中广泛使用的命令行工具,用于从互联网上下载文件。在Windows环境中,它通常需要通过编译源代码或者安装预...了解并掌握wget的使用技巧,无论是对个人还是企业用户,都能在数据获取和备份方面提高效率。

    wget.exe cmd下载网络图片

    本文将深入探讨如何使用`wget.exe`通过CMD(命令提示符)来下载网络图片,并介绍相关的使用技巧。 `wget.exe`是GNU项目的一部分,最初为Linux系统设计,但后来也被广泛应用于Windows环境。它支持HTTP、HTTPS和FTP等...

    Get cookies google 插件,使用特别方便,以后wget下载

    4. **浏览器脚本分享交流.url**:这个文件可能是社区或论坛的链接,用户可以在那里与其他用户交流关于浏览器脚本(包括但不限于插件)的使用经验和技巧。 综上所述,这个插件的主要目标用户是经常使用wget的开发者...

    Python使用wget实现下载网络文件功能示例

    例如,进程与线程操作、Socket编程、数据结构与算法、函数使用技巧、字符串操作、Python的入门与进阶教程以及文件与目录操作技巧。这些都是学习Python编程时应该掌握的基础内容,对于提升编程技能和解决实际问题都...

    Ubuntu使用技巧

    这篇文档“Ubuntu使用技巧”深入探讨了Ubuntu命令行的使用方法,是解决日常问题和提升效率的宝贵资源。以下是一些主要的知识点: 1. **终端基础**:Ubuntu中的终端是执行命令、管理文件和系统的主窗口。你可以通过...

Global site tag (gtag.js) - Google Analytics