`
hyl198611
  • 浏览: 228383 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

linux curl 用法详解

阅读更多
linux ‍‍curl用法详解

‍‍curl的应用方式,一是可以直接通过命令行工具,另一种是利用libcurl库做上层的开发。本篇主要总结一下命令行工具的http相关的应用, 尤其是http下载方面的;下一篇再讲基于libcurl库的开发。

 
 
   curl的命令行工具功能非常强大,这些数据交互的功能基本上都是通过URL方式进行的,我们先来看看curl对多个URL的灵活操作,这些规则使我们的 批处理需求应用起来非常方便。
 
   1、用{}表示多个URL
   如 http://site.{one,two,three}.com, 只要在{}中写上不同的部分,就可以表示3个URL了。
 
   2、用[]表示多个URL
   如 ftp://ftp.numericals.com/file[1-100].txt,ftp://ftp.numericals.com/file[001-100].txt,ftp://ftp.letters.com/file[a-z].txt, []中表示按数字或字母的顺序排列。
   还能表示不连续的排列,如 http://www.numericals.com/file[1-100:10].txt,http://www.letters.com/file[a-z:2].txt,":" 后面的数字表示等差排列的阶跃数。
 
   3、结合起来使用
   如 http://any.org/archive[1996-1999]/vol[1-4]/part{a,b,c}.html。
 
 
   curl命令行工具的基本语句为:curl [options] [URL...],即 curl [选项] [下载地址]。因此,如果你想下载百度的首页,最简单的方法启动cmd,进入curl安装目录,输入命令:curl http://www.baidu.com,回车,你的输出窗口将立即出现百度首页 的html数据。
   对于所有的布尔型option,基本上--option表示支持这个选项,--no-option表示禁用这个选项。下面总结几个比较有用的 options。
 
   1、-o/--output <file>
   这个基本上要算最常用的选项了,用于将下载的数据保存到某个文件中。如 curl -o baidu.html http://www.baidu.com则将百度首页保存到baidu.html 文件中了。下载过程中标准输出还会显示下载的统计信息,比如进度、下载字节数、下载速度等。如果指定输出为"-",则下载数据会输出到标准输出。
   如果输出的文件是一个多级目录的话,则要配合--create-dirs选项,--create-dirs将自动创建设置的输出目录。
   如果希望保存到本地的文件名和服务器上的相同,就可以直接用-O选项(大写O),而省去指定本地文件名。
   如果下载多个数据文件,可以使用上面提到的多URL规则。下载文件名也可以批量自定义,就是使用"#"。可以将"#"加到文件名当中,这样实际文件名中 的#将被多个URL中的当前字符串代替,如 curl http://{site,host}.host[1-5].com -o "#1_#2",#1将被"site"或"host"代替,#2将被1-5之间的数字代替,也就是被当前被处理的URL中的字符串代替。
   另外下载数据的时候,可以加个"-#"选项,用一个进度条来代替文本表示进度。
 
   2、-c/--cookie-jar <file name> 和 -b/--cookie <name=data>
   这是两个操作cookie的选项,很多服务器是需要cookie信息的。用前一个选项可以指定一个文件,将其他文件中的cookie或者从服务器得到的 cookie写到文件中;后一个选项则用来向服务器发送cookie信息,可以用"name=data"的形式,也可以直接跟一个保存cookie的文件 名。
 
   3、-x/--proxy <proxyhost[:port]>
   该选项为http指定代理及端口,如果不指定端口,默认为1080。如 curl -x 201.36.208.19:3128 http://curl.haxx.se/。
 
   4、-u/--user <user:password> 和 -U/--proxy-user <user:password>
   登录某些页面或ftp需要先进行认证,输入用户名和密码。curl的这个选项可以直接处理这类操作,用指定的账号和密码进行登录认证。
   后面的选项指定代理的用户名和密码,这样便可以直接用这个代理访问网页了,如 curl -U user:password -x 201.36.208.19:3128 http://curl.haxx.se/。
 
   5、-A/--user-agent <agent string>
   该选项可以指定客户端类型,服务器通过该选项判断用户应用的平台及浏览器信息。如 curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" http://www.clientinfo.com,
表示告诉服务器,客户端是运行在Windows 2000系统上的IE6.0。

  

    6、-d/--data <data>
   该选项用来以POST方式向http服务器发送特定数据,最常用的就是提交表单。如 curl -d "user=username&password=111" http://www.login.com, 表示用账号username和密码111向站点发送登录申请。其中多个数据段可以用"&"进行连接一起发送;如果数据前面加上符号"@",则数据 来源为后面指定的文件,如 curl -d password=@D:\pw.txthttp://www.login.com。

  

    7、-C/--continue-at <offset>
   改选项提供断点续传功能,与-o选项配合使用。如 curl -c -O http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3。 如果指定offset,则从offset的位置开始续传。如果未指定offset,或者直接用"-C -",则curl会自己分析该从什么位置开始续传。

  

    8、-r/--range <range>
   该选项指定下载字节的范围,常应用于分块下载文件。range的表示方式有多种,如100-500,则指定从100开始的400个字节数据;-500表示 最后的500个字节;5000-表示从第5000个字节开始的所有字节;另外还可以同时指定多个字节块,中间用","分开。如
   curl -r 0-1024000 -o new_divide_1.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
   curl -r 1024001-2048000 -o new_divide_2.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
   curl -r 2048001- -o new_divide_3.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
   这样就会将目标mp3文件分块下载为3个文件,然后可以用dos的copy命令:copy new_divide_1.mp3/b + new_divide_2.mp3/b + new_divide_3.mp3/b new_divide.mp3即可将3个分块文件合并为一个完整的mp3文件。
 
   9、-w/--write-out <format>
   该选项格式化输出一些用户操作的数据信息,用到的格式化输出符除了"\n","\r","\t"这些常见转义符外,还包括"@"和"%"。其 中"@filename"表示输出filename文件中的数据,"@-"表示输出用户写入标准输入的数据;"%"标识符后面跟上定义的关键字, 则可以输出对应的curl数据,常用的关键字有:
   http_code —— 上次操作返回的响应码;
   time_total —— 上次操作耗时,单位为秒;
   time_connect —— TCP连接远程主机的耗时,单位为秒;
   time_pretransfer —— 文件真正开始传输之前交互耗时,单位为秒,可能主要包括一些命令处理和协议分析的耗时;
   time_starttransfer —— 文件的第一个字节开始传输之前的耗时,单位为秒,包括time_pretransfer和服务器计算结果的时间;
   size_download —— 下载的总字节数;
   size_upload —— 上传的总字节数;
   size_request —— 发送http请求的总字节数;
   speed_download —— curl成功下载的平均下载速度;
   speed_upload —— curl成功上传的平均上传速度;
   举例:curl -o page.html -s -w %{time_connect}:%{time_starttransfer}:%{time_total} http://curl.haxx.se/,其中-s表示安静模式,即略去所有 状态信息。
 
   10、--connect-timeout <seconds> 和 -m/--max-time <seconds>
   前者表示允许的连接的最长耗时,单位为秒;后者表示允许的整个操作的最长耗时,单位为秒,这个选项对于控制一个批处理操作的时长非常有用。
 
   11、--limit-rate <speed> 、 -Y/--speed-limit <speed> 和 -y/--speed-time <time>
   --limit-rate <speed>指定最大的数据传输率,单位为bytes/s,也可以用'k'或'K'表示kb/s,'m'或'M'表示mb/s,'g'或 'G'表示gb/s,所给的speed为平均传输率,短时间峰值可能会超过此值;
-Y/--speed-limit <speed>指定最小传输率,单位为bytes/s,如果小于speed值,则传输中止,如此时-y选项没有被设置,默认time为 30;-y/--speed-time <time>指定-Y选项的有效时间段,如果-Y选项没有被设置,默认为1。

    12、--max-filesize <bytes>
   该选项指定所要下载的文件的最大长度,如果超过bytes值,则下载并不开始,curl返回退出码63。
 
   13、--retry <num> 、 --retry-delay <seconds> 和 --retry-max-time <seconds>
   当传输过程中出现错误,如超时、FTP 5xx返回码或者HTTP 5xx返回码,curl会进行按照设置进行重试,这几个选项都与重试有关。--retry <num>设置重试次数,--retry-delay <seconds>设置两次重试的间隔时间,--retry-max-time <seconds>设置两次重试间隔的最长时间。默认情况下,curl不进行重试;如果重试,第一次间隔1秒,之后每次都间隔上一次的2倍时 间,直到间隔时间达到10分钟,之后的重试都将采用10分钟间隔。如果这3个选项的值被重新设置,则执行设置值。
 
   14、-T/--upload-file <file>
   该选项是上传命令,如向http服务器上传一个文件:curl -T D:\new_divide.mp3 http://www.uploadserver.com/path/; 向一个ftp服务器上传文件:curl -T D:\new_divide.mp3 -u user:password ftp://upload_site:port/path/。


   curl定义了一组"EXIT CODES",用来标识在出现错误时的相关信息,目前范围从1-83,具体信息可以查阅curl库自带的文档。这些退出码对于我们分析错误及原因有很大帮 助。
 
 
   以上简单介绍了一下利用curl命令行工具进行一些简单的http和ftp应用,大家可以试着多用一下,会慢慢发现curl的强大功能,有很多独特的功能 用起来非常简单方

文章转自:http://hi.baidu.com/webwatch/blog/item/86cb98a2d08212bccaefd060.html
分享到:
评论

相关推荐

    Linux curl命令参数详解.docx

    Linux curl 命令参数详解 Linux curl 命令是通过 URL 语法在命令行下上传或下载文件的工具软件,它支持 HTTP、HTTPS、FTP、FTPS、Telnet 等多种协议,常被用来抓取网页和监控 Web 服务器状态。 一、抓取网页 ...

    PHPCurl使用详解.doc

    在Linux或Unix系统中,可能需要手动下载并编译cURL库,然后将其与PHP配置文件链接。 cURL的核心在于`curl_setopt()`函数,它允许为CURL会话设置各种选项。例如: - `CURLOPT_INFILESIZE`:当上传文件到远程服务器...

    超全的curl命令详解文档集.zip

    linux curl是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称url为下载工具。  一,curl命令参数,有好多我没有用过,如果有误的地方,还请指正。 ...

    Linux curl命令详解

    例子中的用法展示了如何获取网页内容、保存网页、测试HTTP返回码、使用代理服务器以及处理Cookie。这些基本操作涵盖了`curl`命令的大部分功能,使其成为Linux系统中进行网络操作不可或缺的工具。通过熟练掌握`curl`...

    curl命令详解.pdf

    `curl`命令是Linux系统中一个强大的用于传输数据的命令行工具,它可以处理HTTP、HTTPS、FTP、FTPS等众多网络协议。`curl`广泛应用于数据下载、上传、测试网络连接速度以及诊断网络问题。本篇文章将深入解析`curl`...

    curl命令详解.docx

    - 使用Linux的重定向功能保存:`curl [URL] &gt; filename` - 内置选项 `-o` (小写) 保存网页:`curl -o filename [URL]` - 内置选项 `-O` (大写) 保存网页中的文件:如果URL指向一个资源,`-O`会根据文件名自动保存。 ...

    curl教程详解.pdf

    `curl`命令是Linux命令行下的一款强大工具,用于与各种服务器进行交互,支持HTTP、HTTPS、FTP等多种协议。它的核心在于通过命令行参数来控制请求的行为,包括发送GET、POST请求、设置请求头、使用代理等。下面将详细...

    Linux命令详解词典(绝版)

    5. 网络管理命令:包括用于网络测试的`ping`,用于网络配置的`ifconfig`(在某些Linux发行版中已经被`ip`命令取代),用于网络数据传输的`wget`和`curl`,以及用于网络诊断的`netstat`等。 6. 软件包管理命令:不同...

    [Linux命令详解词典]

    《Linux命令详解词典》是由施威铭研究室编著的一本详尽解析Linux命令的参考书籍,旨在帮助用户深入理解和掌握Linux操作系统中的各种命令。这本书以扫描版的形式提供,包含PDF格式,方便读者在线阅读或下载。标签...

    curl命令详解-IT老卢.pdf

    由IT老卢编写的这份文档详细介绍了`curl`命令的使用方法,涵盖了基本用法、POST请求、JSON数据传输、文件下载、设置请求头、超时控制、代理使用以及显示请求和响应头等多个方面。 1. **基本用法**:`curl`命令最...

    Linux curl表单登录或提交与cookie使用详解

    总结起来,使用`curl`进行Linux表单登录或提交操作,关键在于正确构造HTTP请求,包括POST方法、表单数据和`cookie`管理。然而,这种方法可能受到网站安全策略的限制,因此在实际应用中需谨慎。对于那些支持的网站,`...

    win10下用vs2019编译好的curl 64位库 版本7.84.0

    在win10用cmake3.22与vs2019编译好的curl库,版本号为7.84.0(当下最新版,支持SLL)。库文件已经整理成了lib、include的结构,其中还内置curl...curl现在在linux与win10都是有内置的,在命令行中可以直接使用curl指令。

    linux命令行下使用curl命令查看自己机器的外网ip

    您可能感兴趣的文章:Linux 中 CURL常用命令详解linux下为php添加curl扩展的方法Linux下命令行cURL的10种常见用法示例linux curl命令详解及实例分享Linux中curl命令和wget命令的使用介绍与比较linux shell中curl ...

    Linux Curl 命令满足你的工作需求!简直不要太香了

    2. Curl常用参数详解: - `-I`:只显示HTTP响应的头部信息,不获取实际内容。 - `-d`:使用HTTP POST方法传递数据,可以是JSON格式或其他形式。 - `-o`:将输出写入指定文件,而不是在终端上显示。 - `-s`:静默...

    书籍Linux编程命令详解

    本书“Linux编程命令详解”旨在帮助读者深入理解和掌握Linux环境下的编程与命令行操作,这对于提升工作效率和进行系统级别的调试至关重要。 在Linux中,命令行界面(CLI)是与操作系统交互的主要方式之一,它提供了...

    Linux 中 CURL常用命令详解

    Linux中的cURL是一个强大的命令行工具,用于传输数据到或从服务器,支持多种协议,包括HTTP、HTTPS、FTP、FTPS等。它广泛应用于系统管理、自动化任务和脚本编写中。以下是对cURL常用命令的详细解释: 1. **下载单个...

Global site tag (gtag.js) - Google Analytics